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PubMed 



Blast 2 Sequences results 

Entrez BLAST OMIM Taxonomy Structure 



BLAST 2 SEQUENCES RESULTS VERSION BLASTN 2.2.17 [Aug-26-2007] 

Match :|1 Mismatch:|:2 \ gap open:|5 j gap extension: 2 

x_dropofr: |0 : expect:|lO.0O0C wordsize: [ll ! Filter IE View option [Standard 

Masking character option |X for protein, n for nucl eotide Masking color option [Black JS 
F Show CDS translation Align ^ 



Sequence 1: gi |542Q376| He patitis C virus type lb complete genome, isolate Con! 
Length = 9604(1 ..9605) 

Sequence 2: gi|5441 83 1 [Hepatitis C virus replicon I377/NS2-3^UTR 
Length = 8636 (1 .. 8637) 



iL 




NOTE:Bitscore and expect value are calculated based on the size of the nr database. 



NO rE:If protein translation is reversed, please repeat the search with reverse strand of the query 
sequence. 



Score = 1.261e+04 bits (6560), Expect = 0.0 
Identities = 6646/6646 (100%), Gaps = 0/6646 (0%) 
Strand=Plus/Plus 



CDS:polyprotein [Hep 809 

Query 2767 

Sbjct 1799 

CDS: non-structural p 1 



AMDREMAASCGGAVFVGLI 
CCATGGACCGGGAGATGGCAGCATCGTGCGGAGGCGCGGTTTTCGTAGGTCTGATA 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
CCATGGACCGGGAGATGGCAGCATCGTGCGGAGGCGCGGTTTTCGTAGGTCTGATA 
MDREMAASCGGAVFVGLI 



CDS : polyprot ein [ Hep 
Query 

Sbjct 



829 L TLSPHYKLFLARLIWWLQ 
2827 TGACCTTGTCACCGCACTATAAGCTGTTCCTCGCTAGGCTCATATGGTGGTTACAA 

II II I I II I I I I I I I M II I I I I I I II II I II M I II I II I II I II I I I II I II II 
1859 TGACCTTGTCACCGCACTATAAGCTGTTCCTCGCTAGGCTCATATGGTGGTTACAA 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi71 
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CDS : non-structural p 20 



H 



K 



R 



W W 



CDS : polyprotein [Hep 

Query 



Sbjct 
CDS : non- 



structural p 



849 FITRAEAHLQVWIPPLNVR 
2887 TTATCACCAGGGCCGAGGCACACTTGCAAGTGTGGATCCCCCCCCTCAACGTTCGG 
I I I I I i I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I i I M M I I I I I 
1919 TTATCACCAGGGCCGAGGCACACTTGCAAGTGTGGATCCCCCCCCTCAACGTTCGG 
40 FITRAEAHLQVWIPPLNVR 



CDS : polyprotein [Hep 869 

Query 2947 

Sbjct 1979 

CDS :non-structural p 60 



GRDAVILLTCAIHPELIFT 
GCCGCGATGCCGTCATCCTCCTCACGTGCGGGATCCACCCAGAGCTAATCTTTACC 
I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCGCGATGCCGTCATCCTCCTCACGTGCGCGATCCACCCAGAGCTAATCTTTACC 
GRDAVILLTCAIHPELIFT 



CDS: polyprotein [Hep 889 
Query 



Sbjct 

CDS: non-structural p 



Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



TKILLA ILGPLMVLQAGIT 
3007 CCAAAATCTTGCTCGCCATACTCGGTCCACTCATGGTGCTCCAGGCTGGTATAACC 
I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
2039 CCAAAATCTTGCTCGCCATACTCGGTCCACTCATGGTGCTCCAGGCTGGTATAACC 
TK-ILLAILGPLMVLQAGIT 



80 



CDS: polyprotein [Hep 909 
Query 



VPYFVRAHGLIRACMLVRK 
3067 TGCCGTACTTCGTGCGCGCACACGGGCTCATTCGTGCATGCATGCTGGTGCGGAAG 
I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I 1 I 
■2099 TGCCGTACTTCGTGCGCGCACACGGGCTCATTCGTGCATGCATGCTGGTGCGGAAG 
100 VPYFVRAHGLIRACMLVRK 

929 AGGHYVQMALMKLAALTGT 
3127 CTGGGGGTCATTATGTCCAAATGGCTCTCATGAAGTTGGCCGCACTGACAGGTACG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2159 CTGGGGGTCATTATGTCCAAATGGCTCTCATGAAGTTGGCCGCACTGACAGGTACG 
120 AGG HYVQMALMKLAALTGT 

94 9 VYDHLTPLRDWAHAGLRDL 
3187 TTTATGACCATCTCACCCCACTGCGGGACTGGGCCCACGCGGGCCTACGAGACCTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I M I I I I I I I I 
2219 TTTATGACCATCTCACCCCACTGCGGGACTGGGCCCACGCGGGCCTACGAGACCTT 
140 VYDHLTPLRDWAHAGLRDL 



CDS:polyprotein [Hep 969 

Query 3247 

Sbjct 2279 

CDS :non- structural p 160 



CDS: polyprotein [Hep 989 
Query 



Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 



VAVEPVVFSDMETKVITWG 
TGGCAGTTGAGCCCGTCGTCTTCTCTGATATGGAGACCAAGGTTATCACCTGGGGG 
I I I I I I I I i M I I I I I I I I M M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGCAGTTGAGCCCGTCGTCTTCTCTGATATGGAGACCAAGGTTATCACCTGGGGG 
VAVEPVVFSDMETKVITWG 



DTAACGDI ILGLPVSARRG 
3307 ACACCGCGGCGTGTGGGGACATCATCTTGGGCCTGCCCGTCTCCGCCCGCAGGGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2339 ACACCGCGGCGTGTGGGGACATCATCTTGGGCCTGCCCGTCTCCGCCCGCAGGGGG 
180 DTAACGDI ILGLPVSARRG 

1009 EI HLGPADSLE.GQGWRLLA 
3367 AGATACATCTGGGACCGGCAGACAGCCTTGAAGGGCAGGGGTGGCGACTCCTCGCG 
I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2399 AGATACATCTGGGACCGGCAGACAGCCTTGAAGGGCAGGGGTGGCGACTCCTCGCG 
200 EIH LGPADS.LE GQGWR LLA 

1029 ITAYSQQTRGLLGCIITSL 
3427 TTACGGCCTACTCCCAACAGACGCGAGGCCTACTTGGCTGCATCATCACTAGCCTC 
I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I M M I I I I I I I I I I I I I I I I I I 
2459 TTACGGCCTACTCCCAACAGACGCGAGGCCTACTTGGCTGCATCATCACTAGCCTC 
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CDS: non-structural p 220 



A 



Q Q T R G 



CDS:polyprotein [Hep 104 9 

Query 3487 

Sbjct 2519 

CDS : non-structural p 240 



GRDRNQVEGEVQVVSTATQ 
GCCGGGACAGGAACCAGGTCGAGGGGGAGGTCCAAGTGGTCTCCACCGCAACACAA 
{ I i I I { I I I I I I I I I I I I I' I i I I i I I I I I I I } I 1 I I M M i i I I I I I I I I I I I I M 
GCCGGGACAGGAACCAGGTCGAGGGGGAGGTCCAAGTGGTCTCCACCGCAACACAA 
GRDRN QVEGEVQVVSTATQ 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



1069 FLATCVNGVCWTVYHG AGS 
3547 TCCTGGCGACCTGCGTCAATGGCGTGTGTTGGACTGTCTATCATGGTGCCGGCTCA 
I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
257 9 TCCTGGCGACCTGCGTC7UVTGGCGTGTGTTGGACTGTCTATCATGGTGCCGGCTCA 
260 FLATCVNGVCWTVYHGAG. S 

1089 TLAGPKGPITQMYTNVDQD 
3607 CCCTTGCCGGCCCA/iAGGGCCCAATCACCCAAATGTACACCAATGTGGACCAGGAC 
I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I 
2639 CCCTTGCCGGCCCAAAGGGCCCAATCACCCAAATGTACACCAATGTGGACCAGGAC 
280 TLAGPKGPITQMYTNVDQD 

1109 VGWQAPPGARSLTPCTC. GS 
3667 TCGGCTGGCAAGCGCCCCCCGGGGCGCGTTCCTTGACACCATGCACCTGCGGCAGC 
I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 1 I M I I I I I I I I 
2699 TCGGCTGGCAAGCGCCCCCCGGGGCGCGTTCCTTGACACCATGCACCTGCGGCAGC 
300 VGWQAPPGARSLTPCTCGS 



CDS: polyprotein [Hep 1129 

Query 3727 

Sbjct 2759 

CDS : non-structural p 320 



DLYLVTRHADVI PVRRRGD 
ACCTTTACTTGGTCACGAGGCATGCCGATGTCATTCCGGTGCGCCGGCGGGGCGAC 
I I I I I I .1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCTTTACTTGGTCACGAGGCATGCCGATGTCATTCCGGTGCGCCGGCGGGGCGAC 
DLYLVTRHADVI PVRRRGD 



CDS : polyprotein [Hep 1149 

Query 3787 

Sbjct 2819 

CDS :non- structural p 34 0 



RGSLLSPRPVSYLKGSSGG 
GGGGGAGCCTACTCTCCCCCAGGCCCGTCTCCTACTTGAAGGGCTCTTCGGGCGGT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n 1 1 1 1 1 1 1 

GGGGGAGCCTACTCTCCCCCAGGCCCGTCTCCTACTTGAAGGGCTCTTCGGGCGGT 
RGSLLSPRPVSYLKGSSGG 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [ Hep 
Query 

Sbjct 

CDS :non- structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 



1169 LLC P S G HAVG I FR.AAVC T R 
3847 TGCTCTGCCCCTCGGGGCACGCTGTGGGCATCTTTCGGGCTGCCGTGTGCACCCGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
287 9 TGCTCTGCCCCTCGGGGCACGCTGTGGGCATCTTTCGGGCTGCCGTGTGCACCCGA 
360 LLCPSGHAVGIFRAAVCTR 

1189 VAKAVDFVPVESMETTMRS 
3907 TTGCGAAGGCGGTGGACTTTGTACCCGTCGAGTCTATGGAAACCACTATGCGGTCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 1 I I 
2939 TTGCGAAGGCGGTGGACTTTGTACCCGTCGAGTCTATGGAAACCACTATGCGGTCC 
380 VAKAVDFVPVESME'TTMRS 

1209 VFTDNSSPPAVPQTFQVAH 
3967 TCTTCACGGACAACTCGTCCCCTCCGGCCGTACCGCAGACATTCCAGGTGGCCCAT 
I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
2999 TCTTCACGGACAACTCGTCCCCTCCGGCCGTACCGCAGACATTCCAGGTGGCCCAT 
400 VFTDNSSPPAVPQTFQVAH 

1229 HAPTGSGKSTKVPAAYAAQ 
4 027 ACGCCCCTACTGGTAGCGGCAAGAGCACT7VAGGTGCCGGCTGCGTATGCAGCCCAA 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3059 ACGCCCCTACTGGTAGCGGCAAGAGCACT/yVGGTGCCGGCTGCGTATGCAGCCCAA 
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CDS : non-structural p 420 



H 



K 



K 



A A 



A A Q 



CDSrpolyprotein [Hep 124 9 

Query 4087 

Sbjct 3119 

CDS : non-structural p 440 



YKVLVLNPSVAATLGFGAY 
ATAAGGTGCTTGTCCTGAACCCGTCCGTCGCCGCCACCCTAGGTTTCGGGGCGTAT 
I I I I I M i I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I t I i I I I I I i I I I I 
ATAAGGTGCTTGTCCTGAACCCGTCCGTCGCCGCCACCCTAGGTTTCGGGGCGTAT 
YKVLVLNPSVAATLGFGAY 



CDS:polyprotein [Hep 1269 

Query 4147 

Sbjct 3179 

CDS :non- structural p 4 60 



SKAHGIDPNIRTGVRTITT 
CTAAGGCACATGGTATCGACCCTAACATCAGAACCGGGGTAAGGACCATCACCACG 

I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I 
CTAAGGCACATGGTATCGACCCTAACATCAGAACCGGGGTAAGGACCATCACCACG 
SKAHGIDPNIRTGVRTITT 



CDS : polyprotein [ Hep 
Query 

Sbjct 

CDS : non-structural p 



1289 APITYSTYGKFLADGGCSG 
4207 CCCCCATCACGTACTCCACCTATGGCAAGTTTCTTGCCGACGGTGGTTGCTCTGGG 
I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3239 CCCCCATCACGTACTCCACCTATGGCAAGTTTCTTGCCGACGGTGGTTGCTCTGGG 
480 APITYSTYGKFLADGGCSG 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



1309 AYDIIICDECHSTDSTTIL 
42 67 CCTATGACATCATAATATGTGATGAGTGCCACTC7\ACTGACTCGACCACTATCCTG 

I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I ! I I M I I M I I I I I I I I I I I I i I 
32 99 CCTATGACATCAT7\ATATGTGATGAGTGCCACTCAACTGACTCGACCACTATCCTG 
500 AYDIIICDECHS TDSTTIL 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



1329 IGTVLDQ AETAGARLVVLA 
4 327 TCGGCACAGTCCTGGACCAAGCGGAGACGGCTGGAGCGCGACTCGTCGTGCTCGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3359 TCGGCACAGTCCTGGACCAAGCGGAGACGGCTGGAGCGCGACTCGTCGTGCTCGCC 
520 IGTVLDQAETAGARLVVLA 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



1349 ATPPGSVTVPHPNIEEVAL 
4387 CTACGCCTCCGGGATCGGTCACCGTGCCACATCCAAACATCGAGGAGGTGGCTCTG 
I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
3419 CTACGCCTCCGGGATCGGTCACCGTGCCACATCCATy^CATCGAGGAGGTGGCTCTG 
540 ATPPGSVTVPHPNIEEVAL 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS :non- structural p 



1369 STGEI PFY GKAIPIETIKG 
444 7 GCACTGGAGAAATCCCCTTTTATGGCAAAGCCATCCCCATCGAGACCATCAAGGGG 

I I I I I I I M I I I I M I I I I M I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I 
34 7 9 GCACTGGAGAAATCCCCTTTTATGGCAAAGCCATCCCCATCGAGACCATCAAGGGG 
560 STGEIPFYGKAIPIETIKG 



CDS: polyprotein [Hep 1389 

Query 4507 

Sbjct 3539 

CDS :non- structural p 580 



RHLIFCHSKKKCDELAAKL 
GGCACCTCATTTTCTGCCATTCCAAGAAGAAATGTGATGAGCTCGCCGCGAAGCTG 
I I I I I I I I I t M I I I I I I I i I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCACCTCATTTTCTGCCATTCCAAGAAGAAATGTGATGAGCTCGCCGCGAAGCTG 
RHLIFCHSKKKCDELAAKL 



CDS: polyprotein [Hep 1409 

Query 4567 

Sbjct 3599 

CDS :non- structural p 600 



GLGLNAVAYYRGLDVSVI P 
GCCTCGGACTCAATGCTGTAGCATATTACCGGGGCCTTGATGTATCCGTCATACCA 
I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I i I I I 1 t I M I I 
GCCTCGGACTCAATGCTGTAGCATATTACCGGGGCCTTGATGTATCCGTCATACCA 
GLGLNAVAYYRGLDVSVIP 



CDS: polyprotein [Hep 1429 
Query 4 627 

Sbjct . 3659 



SGDVIVVATDALMTGFTGD 
GCGGAGACGTCATTGTCGTAGCAACGGACGCTCTAATGACGGGCTTTACCGGCGAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M i I I I I M I I I I I I I I I I I I 
GCGGAGACGTCATTGTCGTAGCAACGGACGCTCTTU^TGACGGGCTTTACCGGCGAT 
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CDS : non-structural p 620 



V 



V V 



D 



L M T G 



CDSipolyprotein [Hep 1449 

Query 4687 

Sbjct 3719 

CDS: non-structural p 64 0 



DSVIDCNTCVTQTVDFSLD 
ACTCAGTGATCGACTGCAATACATGTGTCACCCAGACAGTCGACTTCAGCCTGGAC 
I I I I I I I I M 11 I I I I I I I t I I i I j I I I M I t M ! I I I I I I I I I I I I I I I I I I I { I 
ACTCAGTGATCGACTGCAATACATGTGTCACCCAGACAGTCGACTTCAGCCTGGAC 
DSVIDCN TCVTQTVDFSLD 



CDS rpolyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



1469 TFTIETTTVPQDAVSRSQR 
4 74 7 CCTTCACCATTGAGACGACGACCGTGCCACAAGACGCGGTGTCACGCTCGCAGCGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
377 9 CCTTCACCATTGAGACGACGACCGTGCCACAAGACGCGGTGTCACGCTCGCAGCGG 
660 TFTIETTTVPQDAVSRSQR 

1489 GRTGRGRMGIYRFVTPGER 
4807 GCAGGACTGGTAGGGGCAGGATGGGCATTTACAGGTTTGTGACTCCAGGAGAACGG 
I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3839 GCAGGACTGGTAGGGGCAGGATGGGCATTTACAGGTTTGTGACTCCAGGAGAACGG 
680 GRTGRGRMGIYRFVTPGER 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



1509 SGMFDSSVLCECYDAGCAW 
4 8 67 CGGGCATGTTCGATTCCTCGGTTCTGTGCGAGTGCTATGACGCGGGCTGTGCTTGG 
I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
38 99 CGGGCATGTTCGATTCCTCGGTTCTGTGCGAGTGCTATGACGCGGGCTGTGCTTGG 
700 SGMFDSSVLCECYDAGCAW 

1529 ELTPAETSVRLRAYLNTPG 
4 927 AGCTCACGCCCGCCGAGACCTCAGTTAGGTTGCGGGCTTACCTAAACACACCAGGG 
I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I M I I I I M I I I 
3959 AGCTCACGCCCGCCGAGACCTCAGTTAGGTTGCGGGCTTACCTAAACACACCAGGG 
720 ELTPAETSVRLRAYLNTPG 

1549 PVCQDHLEFWESVFTGL.TH 
4 987 CCGTCTGCCAGGACCATCTGGAGTTCTGGGAGAGCGTCTTTACAGGCCTCACCCAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
4 019 CCGTCTGCCAGGACCATCTGGAGTTCTGGGAGAGCGTCTTTACAGGCCTCACCCAC 
740 PVCQDHLEFWESVFTGLTH 



CDS: polyprotein [Hep 1569 
Query 



Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS rpolyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



DAHFLSQTKQ AGDNFPYLV 
5047 ACGCCCATTTCTTGTCCCAGACTAAGCAGGCAGGAGACAACTTCCCCTACCTGGTA 

1 1 n 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

4 07 9 ACGCCCATTTCTTGTCCCAGACTAAGCAGGCAGGAGACAACTTCCCCTACCTGGTA 
760 DAHFLSQTKQAGDNFPYLV 



1589 YQATVCARAQAPPPSW DQM 
5107 ACCAGGCTACGGTGTGCGCCAGGGCTCAGGCTCCACCTCCATCGTGGGACCAAATG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M i I I I I I I I I I I I I I I 
4139 ACCAGGCTACGGTGTGCGCCAGGGCTCAGGCTCCACCTCCATCGTGGGACCAAATG 
780 YQATVCARAQAPPPSWDQM 

1609 KCLIRLKPTLHGPTPLLYR 
5167 AGTGTCTCATACGGCTAAAGCCTACGCTGCACGGGCCAACGCCCCTGCTGTATAGG 
I I I I I M M I I I I I I M I I I I I I I I I I I I I I I'M I I I I I I I I I I I I I I I I I I I I I I 
4199 AGTGTCTCATACGGCTAAAGCCTACGCTGCACGGGCCAACGCCCCTGCTGTATAGG 
800 KCLIRLKPTLHGPTPLLYR 



CDS : polyprotein 
Query 

Sbjct 



[Hep 1629 GAVQNEVTTTHPITKYIMA 
5227 GAGCCGTTCAAAACGAGGTTACTACCACACACCCCATAACCAAATACATCATGGCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4259 GAGCCGTTCAAAACGAGGTTACTACCACACACCCCAT7U\CCAAATACATCATGGCA 
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CDS : non-structural p 820 



V 



N 



H 



T K Y 



M 



CDS :polyprotein [Hep 

Query 

Sbjct 

CDS mon- structural p 

CDS :polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [ Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS ; polyprotein [Hep 
■Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 

Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



1649 MSADLEVVTSTWVLVGGVL 
5287 TGTCGGCTGACCTGGAGGTCGTCACGAGCACCTGGGTGCTGGTAGGCGGAGTCCTA 
I I I I I I I I i I I I I I I I I I I I I I I I I I I I I 1 i I I I I 1 I I I i i I I I I I I I I I I I I I 11 
4 319 TGTCGGCTGACCTGGAGGTCGTCACGAGCACCTGGGTGCTGGTAGGCGGAGTCCTA 
840 MSADLEVVTSTW VLVGGVL 

1669 ALAAYCLTTGSVVIVGRII 
534 7 CTCTGGCCGCGTATTGCCTGACAACAGGCAGCGTGGTCATTGTGGGCAGGATCATC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I M I I I I I I I I I I M I 
4 37 9 . CTCTGGCCGCGTATTGCCTGACAACAGGCAGCGTGGTCATTGTGGGCAGGATCATC 
860 ALAAYCLTTGSVVIVGRI I 

1689 SGKPAIIPDREVLYREFD.E 
5407 CCGGAAAGCCGGCCATCATTCCCGACAGGGAAGTCCTTTACCGGGAGTTCGATGAG 
- I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 439 CCGGAAAGCCGGCCATCATTCCCGACAGGGAAGTCCTTTACCGGGAGTTCGATGAG 
880 SGKPAIIPDR EV LY REFDE 

1709 EECASHLPYIEQGMQLAEQ 
54 67 7\AGAGTGCGCCTCACACCTCCCTTACATCGAACAGGGAATGCAGCTCGCCGAACAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
4 4 99 AAGAGTGCGCCTCACACCTCCCTTACATCGAACAGGGAATGCAGCTCGCCGAACAA 
900 EECASHLPYIEQGMQLAEQ 

1729 KQKAIGLLQTATKQAEAAA 
5527 AACAGAAGGCAATCGGGTTGCTGCAAACAGCCACCAAGCAAGCGGAGGCTGCTGCT 
I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I 
4 559 AACAGAAGGCAATCGGGTTGCTGCAAACAGCCACCAAGCAAGCGGAGGCTGCTGCT 
920 KQKAIGLLQTATKQAEAAA 

1749 VVESKWRTLEAFWAKHMWN 
5587 TGGTGGAATCCAAGTGGCGGACCCTCGAAGCCTTCTGGGCGAAGCATATGTGGAAT 
I I I I I I I M I M I I I I I I I I I I I I I I I I I I M I ! I I I I I I I I I I I I I I I I I I I I I I 
4 619 TGGTGGAATCCAAGTGGCGGACCCTCGAAGCCTTCTGGGCGAAGCATATGTGGAAT 
940 VVESKWRT LEAFWAKHMWN 

1769 ISGIQYLAGLSTLPGNPAI 
5647 TCAGCGGGATACAATATTTAGCAGGCTTGTCCACTCTGCCTGGCAACCCCGCGATA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I 
4 679 TCAGCGGGATACAATATTTAGCAGGCTTGTCCACTCTGCCTGGCAACCCCGCGATA 
960 ISGIQYLAGLSTLPGNPAI 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [ Hep 
Query 

Sbjct 

CDS : non-structural p 



1789 SLMAFTASITSPLTTQHTL 
5707 CACTGATGGCATTCACAGCCTCTATCACCAGCCCGCTCACCACCCAACATACCCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 739 CACTGATGGCATTCACAGCCTCTATCACCAGCCCGCTCACCACCCAACATACCCTC 
980 SLMAFTASITSPLTTQHTL 

1809 FNILGGWVAAQLAPPSAAS 
57 67 TTAACATCCTGGGGGGATGGGTGGCCGCCCAACTTGCTCCTCCCAGCGCTGCTTCT 
I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 799 TTAACATCCTGGGGGGATGGGTGGCCGCCCAACTTGCTCCTCCCAGCGCTGCTTCT 
1000 FNILGGWVAAQLAPPSAAS 



CDS : polyprotein 
Query 

Sbjct 



[Hep 1829 FVGAG lAGAAVGS I GL GKV 
5827 TCGTAGGCGCCGGCATCGCTGGAGCGGCTGTTGGCAGCATAGGCCTTGGGAAGGTG 

I I I I I I I I I I I- I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
4 859 TCGTAGGCGCCGGCATCGCTGGAGCGGCTGTTGGCAGCATAGGCCTTGGGAAGGTG 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2xgi?! 
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CDS: non-structural p 1020 F V 



A 



AAV 



K V 



CDS:polyprotein [Hep 184 9 

Query 5887 

Sbjct 4919 

CDS: non-structural p 104 0 



VDILAGYGAGVAGALVAFK 
TGGATATTTTGGCAGGTTATGGAGCAGGGGTGGCAGGCGCGCTCGTGGCCTTTAAG 
I I ! I I I 1 I I I I I I I I I I I I I I I I I I I I i I I I I 1 I I 1 I I I I I I I M I I I I I I I I I I I 
TGGATATTTTGGCAGGTTATGGAGCAGGGGTGGCAGGCGCGCTCGTGGCCTTTAAG 
VDILAGYGAGVAGALVAFK 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS :non- structural p 



1869 MSGEMP STEDLVNLLPAIL 
594 7 TGAGCGGCGAGATGCCCTCCACCGAGGACCTGGTTAACCTACTCCCTGCTATCCTC 
I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I 
4 97 9 TGAGCGGCGAGATGCCCTCCACCGAGGACCTGGTTAACCTACTCCCTGCTATCCTC 
1060 MSGEMPSTEDLVNLLPAIL 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS :non- structural p 



1889 PGALVVGVVCAAILRRHVG 
6007 CTGGCGCCCTAGTCGTCGGGGTCGTGTGCGCAGCGATACTGCGTCGGCACGTGGGC 
I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5039 CTGGCGCCCTAGTCGTCGGGGTCGTGTGCGCAGCGATACTGCGTCGGCACGTGGGC 
1080 PGALVVGVVCAAILRRHVG 



CDS:polyprotein [Hep 190 9 

Query * 6067 

Sbjct 5099 

CDS: non-structural p 1100 



GEGAVQWMNRLIAFASRGN 
GGGAGGGGGCTGTGCAGTGGATGAACCGGCTGATAGCGTTCGCTTCGCGGGGTAAC 
I I I I I I I I I I I I I I M I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGAGGGGGCTGTGCAGTGGATGAACCGGCTGATAGCGTTCGCTTCGCGGGGTAAC 
GEGAVQWMNR,LIAFASRGN 



CDSrpolyprotein [Hep 1929 

Query 6127 

Sbjct 5159 

CDS: non-structural p 1120 

CDS :polyprotein [Hep 1949 

Query 6187 

Sbjct 5219 

CDS : non-structural p 1140 



VSPTHYVPESDAAARVTQI 
TCTCCCCCACGCACTATGTGCCTGAGAGCGACGCTGCAGCACGTGTCACTCAGATC 
I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
TCTCCCCCACGCACTATGTGCCTGAGAGCGACGCTGCAGCACGTGTCACTCAGATC 
VSPTHYVPESDAAARVTQI 

SSLTITQLLKRLHQWINED 
CTAGTCTTACCATCACTCAGCTGCTGAAGAGGCTTCACCAGTGGATCAACGAGGAC 
I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
CTAGTCTTACCATCACTCAGCTGCTGAAGAGGCTTCACCAGTGGATCAACGAGGAC 
SSLTITQLL KRLHQWINED 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS :non- structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 



1969 STPCSGSWLRDVWDWICTV 
624 7 CCACGCCATGCTCCGGCTCGTGGCTAAGAGATGTTTGGGATTGGATATGCACGGTG 
I I I I I I I I I I I I I I I I I I I I I.I I I I M I M I I I I I I I I I I I I I I I I I M I M I I I I 
527 9 CCACGCCATGCTCCGGCTCGTGGCTAAGAGATGTTTGGGATTGGATATGCACGGTG 
1160 STPCSGSWLRDV WDWICTV 



TDFKTWLQSKLLPRLPGVP 
CTGATTTCTVAGACCTGGCTCCAGTCCAAGCTCCTGCCGCGATTGCCGGGAGTCCCC 
II I I II II II II II II II M II II II II I II II II II II I II I II II II 1 I II II I 
5339 CTGATTTCAAGACCTGGCTCCAGTCCAAGCTCCTGCCGCGATTGCCGGGAGTCCCC 
TDFKTWLQSKLLPRLPGVP 



1989 
6307 



1180 



2009 FSCQRGYKGVWRGDGIMQ T 
6367 TCTCATGTCAACGTGGGTACAAGGGAGTCTGGCGGGGCGACGGCATCATGCAAACC 

I I I I II I I I I I M I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I II I 1 I M I I 
5399 TCTCATGTCAACGTGGGTACAAGGGAGTCTGGCGGGGCGACGGCATCATGCAAACC 
1200 F SCQRGYKGVWRGDGIMQT 

2029 CPCGAQITGHVKNGSMRIV 
6427 GCCCATGTGGAGCACAGATCACCGGACATGTGAAAAACGGTTCCATGAGGATCGTG 

II II II I I II I II I I I I I I I II I II II II I M I II M 11 I II I I II II I II II II I 
54 59 GCCCATGTGGAGCACAGATCACCGGACATGTGAAAAACGGTTCCATGAGGATCGTG 



http://www,ncbi,nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?l 
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CDS: non-structural p 1220 C P C 



H V K N 



M R 



V 



CDSipolyprotein [Hep 204 9 

Query 6487 

Sbjct 5519 

CDS :non- structural p 124 0 



PRTCSNTWH GTFPINAYTT 
CTAGGACCTGTAGTAACACGTGGCATGGAACATTCCCCATTAACGCGTACACCACG 
I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I M I I I 
ctaggacctgtagtaacacgtggcatggaacattccccattaacgcgtacaccacg 
prtcsntwhg'tfpinaytt 



CDSrpolyprotein [Hep 2069 

Query 6547 

Sbjct 5579 

CDS: non-structural p 1260 



PCTPSPAPNYSRALWRVAA 
CCTGCACGCCCTCCCCGGCGCCTWVTTATTCTAGGGCGCTGTGGCGGGTGGCTGCT 

I I M M I I I I I I M I I M I I M I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I M I 
CCTGCACGCCCTCCCCGGCGCCAAATTATTCTAGGGCGCTGTGGCGGGTGGCTGCT 
PCTPSPAPNYSRALWRVAA 



CDS:polyprotein [Hep 2089 

Query 6607 

Sbjct 5639 

CDS :non- structural p 1280 



EYVEVTRVGDFHYVTGMTT 
AGTACGTGGAGGTTACGCGGGTGGGGGATTTCCACTACGTGACGGGCATGACCACT 
I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGTACGTGGAGGTTACGCGGGTGGGGGATTTCCACTACGTGACGGGCATGACCACT 
EYVEVTRVGDFHYVTGMTT 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non-structural 



2109 NVKCPCQVPAPEFFTEVDG 
6667 ACGTAAAGTGCCCGTGTCAGGTTCCGGCCCCCGAATTCTTCACAGAAGTGGATGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5 69 9 ACGTAAAGTGCCCGTGTCAGGTTCCGGCCCCCGAATTCTTCACAGAAGTGGATGGG 
1300 NVKC PCQVPAPEFFTEVDG 



CDS: polyprotein [Hep 2129 

Query 6727 

Sbjct 5759 

CDS :non- structural p 1320 



RLHRYAPACKPLLREEVTF 
GGTTGCACAGGTACGCTCCAGCGTGCAAACCCCTCCTACGGGAGGAGGTCACATTC 
I I I I I I I I i I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTTGCACAGGTACGCTCCAGCGTGCAAACCCCTCCTACGGGAGGAGGTCACATTC 
RLHRYAPACKPLLREEVTF 



CDS: polyprotein [Hep 2149 
Query 

Sbjct 

CDS: non-structural p 134 0 V G L N Q 



VGLNQYLVGSQLPCEPEPD 
6787 TCGGGCTCAATCT^TACCTGGTTGGGTCACAGCTCCCATGCGAGCCCGAACCGGAC 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I M I I 
5819 TCGGGCTCAATCAATACCTGGTTGGGTCACAGCTCCCATGCGAGCCCGAACCGGAC 

LVGSQLPCEPEPD 



CDS rpolyprotein [Hep 
Query 



Sbjct 

CDS :non- structural p 



2169 AVLTSMLTDPSHITAETAK 
684 7 CAGTGCTCACTTCCATGCTCACCGACCCCTCCCACATTACGGCGGAGACGGCTAAG 
M I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I 
5879 CAGTGCTCACTTCCATGCTCACCGACCCCTCCCACATTACGGCGGAGACGGCTAAG 
1360 AVLTSMLTDPSHITAETAK 



CDS -.polyprotein [Hep 2189 

Query 6907 

Sbjct 5939 

CDS: non-structural p 1380 



RLARGSPPSLASSSASQLS 
GGCTGGCCAGGGGATCTCCCCCCTCCTTGGCCAGCTCATCAGCTAGCCAGCTGTCT 
I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I 
GGCTGGCCAGGGGATCTCCCCCCTCCTTGGCCAGCTCATCAGCTAGCCAGCTGTCT 
RL ARGSPPSLASSSASQLS 



CDS: polyprotein [Hep 2209 

Query 6967 

Sbjct 5999 

CDS:non-structural p 1400 



PSLKATCTTRHDSPDADLI 
CTTCCTTGAAGGCAACATGCACTACCCGTCATGACTCCCCGGACGCTGACCTCATC 

I I I I I I I I I I I I I I I M I I I I I I 1 1 I I I M I I I I I I I I I I I I I I I I M I I I I I I I I 
CTTCCTTGAAGGCAACATGCACTACCCGTCATGACTCCCCGGACGCTGACCTCATC 
PSLKATCTTRHDSPDADLI 



CDS: polyprotein [Hep 2229 
Query 7027 

Sbjct 6059 



ANLLWRQEMGGNITRVESE 
CCAACCTCCTGTGGCGGCAGGAGATGGGCGGGAACATCACCCGCGTGGAGTCAGAA 
I I I I I I I I I I I M I I I I I I I I Tl I I I I I I I I I I I I I I I I I I I I I I M I I I I i I I I I 
CCAACCTCCTGTGGCGGCAGGAGATGGGCGGGAACATCACCCGCGTGGAGTCAGAA 



http://wvvw.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi71 



10/18/07 



Blast Result 



Page 9 of 14 



CDS: non-structural p 1420 



W R 



M G G N 



R V 



CDS:polyprotein [Hep 2249 K V V I L D 



Q A 



E R 



Query 
Sbjct 

CDS: non-structural p 1440 K V 



7 087 AGGTAGTAATTTTGGACTCTTTCGAGCCGCTCCAAGCGGAGGAGGATGAGAGGGAA 
I I I I I I I I I I I I I I I I I M I I I I I I i I I i I I j I I I I I I I I I I I I I I I I I I I I I I ( I 
6119 AGGTAGTAATTTTGGACTCTTTCGAGCCGCTCCAAGCGGAGGAGGATGAGAGGGAA 



Q A E 



CDS:polyprotein [Hep 2269 
Query 



Sbjct 

CDS: non-structural p 14 60 



SVP.AEILRRSRKFPRAMPI 
714 7 CCGTTCCGGCGGAGATCCTGCGGAGGTCCAGGAAATTCCCTCGAGCGATGCCCATA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
617 9 CCGTTCCGGCGGAGATCCTGCGGAGGTCCAGGAAATTCCCTCGAGCGATGCCCATA 
SVPAEILRRSRKFPRAMPI 



CDSrpolyprotein [Hep 2289 
Query 



Sbjct 

CDS: non-structural p 



AR PDYNPPLLESWKDPDYV 
7207 GACGCCCGGATTACAACCCTCCACTGTTAGAGTCCTGGAAGGACCCGGACTACGTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M 
6239 CACGCCCGGATTACAACCCTCCACTGTTAGAGTCCTGGi\AGGACCCGGACTACGTC 
1480 ARPDYNPPLLESWKDPDYV 



CDSipolyprotein [Hep 2309 
Query 

Sbjct 

CDS: non-structural p 1500 



PVVHGCPLPPAKAPPIPPP 
7267 CAGTGGTACACGGGTGTCCATTGCCGCCTGCCAAGGCCCCTCCGATACCACCTCCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I M I 
6299 CAGTGGTACACGGGTGTCCATTGCCGCCTGCCAAGGCCCCTCCGATACCACCTCCA 
PVVHGCPLPPAKAPPIPPP 



CDSrpolyprotein [Hep 2329 R K 



Query 

Sbjct 

CDS : non-structural p 



V 



L S 



V 



A 



7327 GGAAGAGGACGGTTGTCCTGTCAGAATCTACCGTGTCTTCTGCCTTGGCGGAGCTC 
I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

6359 GGAAGAGGACGGTTGTCCTGTCAGAATCTACCGTGTCTTCTGCCTTGGCGGAGCTC 
1520 RKRTVVLSESTVSSALAEL 



CDSrpolyprotein [Hep . 2349 
Query 7387 

Sbjct 6419 
CDS :non- structural p 1540 



TKTFGSSESSAVDSGTATA 
CAAAGACCTTCGGCAGCTCCGAATCGTCGGCCGTCGACAGCGGCACGGCAACGGCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
CAAAGACCTTCGGCAGCTCCGAATCGTCGGCCGTCGACAGCGGCACGGCAACGGCC 
TKTFGSSESSAVDSGTATA 



CDSrpolyprotein [Hep 2369 

Query « 7 447 

Sbjct 6479 

CDS: non-structural p 1560 



PDQPSDDGDAGSDVESYSS 
CTGACCAGCCCTCCGACGACGGCGACGCGGGATCCGACGTTGAGTCGTACTCCTCC 

M I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGACCAGCCCTCCGACGACGGCGACGCGGGATCCGACGTTGAGTCGTACTCCTCC 
PDQPSDDGDAGSDVESYSS 



CDSrpolyprotein [Hep 2389 

Query 7507 

Sbjct 6539 

CDS: non-structural p 1580 



P'PLEGE PG D P DLS DG SWS T 
CCCCCCTTGAGGGGGAGCCGGGGGATCCCGATCTCAGCGACGGGTCTTGGTCTACC 
I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCCCCTTGAGGGGGAGCCGGGGGATCCCGATCTCAGCGACGGGTCTTGGTCTACC 
PPLEGEPGDPDLSDGSWST 



CDSrpolyprotein [Hep 2409 
Query 

Sbjct 

CDS: non-structural p 



SEEASEDVVCCSMSYTWTG 
7567- GCGAGGAGGCTAGTGAGGACGTCGTCTGCTGCTCGATGTCCTACACATGGACAGGC 
I M I I I I I I I I I I I I i I I I I I I I I t I I I M t I M M I I I I I I I I I I I I I I I I I I I I 
65 99 GCGAGGAGGCTAGTGAGGACGTCGTCTGCTGCTCGATGTCCTACACATGGACAGGC 
1600 SEEASEDV VCCSMSYTWTG 



CDS r polyprotein 
Query 

Sbjct 



[Hep 2429 L I T PCAAEET KL*PI NALSN 
7 627 TGATCACGCCATGCGCTGCGGAGGAAACCAAGCTGCCCATCAATGCACTGAGCAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6659 TGATCACGCCATGCGCTGCGGAGGA7\ACCAAGCTGCCCATCAATGCACTGAGCAAC 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?! 
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CDS: non-structural p 1620 L I 



A A 



K 



N A 



N 



CDSrpolyprotein [Hep 24 4 9 

Query 7687 

Sbjct 6719 

CDS .-non-structural p 164 0 



LLRHHNLVYATTSRSASLR 
TGCTCCGTCACCACAACTTGGTCTATGCTACAACATCTCGCAGCGCAAGCCTGCGG 
I I I I I i i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I 
TGCTCCGTCACCACAACTTGGTCTATGCTACAACATCTCGCAGCGCAAGCCTGCGG 
LLRHHNLVYATTSRSASLR 



CDS :polyprotein [Hep 2469 

Query 7747 

Sbjct 6779 

CDS: non-structural p 1660 



KKVTFDRLQV- LDDHYRDVL 
AGAAGGTCACCTTTGACAGACTGCAGGTCCTGGACGACCACTACCGGGACGTGCTC 
I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
AGAAGGTCACCTTTGACAGACTGCAGGTCCTGGACGACCACTACCGGGACGTGCTC 
KKVTFDRLQVLDDHYRDVL 



CDS:polyprotein [Hep 2489 
Query 

Sbjct 

CDS :non- structural p 



EMKAKASTVKAKLLSVEEA 
7807 AGATGAAGGCGAAGGCGTCCACAGTTAAGGCTAAACTTCTATCCGTGGAGGAAGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6839 AGATGAAGGCGAAGGCGTCCACAGTTAAGGCTA7U\CTTCTATCCGTGGAGGAAGCC 
1680 EMKAKASTVKAKLLSVEEA 



CDS:polyprotein [Hep 2509 

Query 7867 

Sbjct 6899 

CDS: non-structural p 1700 



KLTPPHSARSKFGYGAKDV 
AGCTGACGCCCCCACATTCGGCCAGATCTAAATTTGGCTATGGGGCAAAGGACGTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCTGACGCCCCCACATTCGGCCAGATCTAAATTTGGCTATGGGGCAAAGGACGTC 
KLTPPHSARSKFGYGAKDV 



CDS:polyprotein [Hep 2529 

Query 7927 

Sbjct 6959 

CDS: non-structural p 1720 



NLSSKAVNHIRSVWKDLLE 
ACCTATCCAGCAAGGCCGTTAACCACATCCGCTCCGTGTGGAAGGACTTGCTGGAA 
I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCTATCCAGCAAGGCCGTTAACCACATCCGCTCCGTGTGGAAGGACTTGCTGG7U\ 
NLSSKAVNHIRSVWKDLLE 



CDS : polyprotein [ Hep 
Query 

Sbjct 

CDS: non-structural p 



2549 TETPI DTTIMAKNEVFCVQ 
7 987 CTGAGACACCAATTGACACCACCATCATGGCAAAAAATGAGGTTTTCTGCGTCCAA 
I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I 
7019 CTGAGACACCAATTGACACCACCATCATGGCAAAAAATGAGGTTTTCTGCGTCCAA 
1740 TETPIDTTIMAKNEVFCVQ 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



2569 EKGGRKPARLIVFPDLGVR 
8047 AGAAGGGGGGCCGCAAGCCAGCTCGCCTTATCGTATTCCCAGATTTGGGGGTTCGT 
I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
707 9 AGAAGGGGGGCCGCAAGCCAGCTCGCCTTATCGTATTCCCAGATTTGGGGGTTCGT 
1760 EKGGRKPARLIVFPDLGVR 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS :non-structural p 



2589 CEKMA LYDVVSTLPQAVMG 
8107 GCGAGAAAATGGCCCTTTACGATGTGGTCTCCACCCTCCCTCAGGCCGTGATGGGC 
I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7139 GCGAGAAAATGGCCCTTTACGATGTGGTCTCCACCCTCCCTCAGGCCGTGATGGGC 
1780 CEKMALYDVVSTLPQAVMG 



CDS: polyprotein [Hep 2609 

Query 8167 

Sbjct 7199 

CDS : non-structural p 1800 



SYGFQYSPGQRVEFLVNAW 
CATACGGATTCCAATACTCTCCTGGACAGCGGGTCGAGTTCCTGGTGAATGCCTGG 
I I I I I I I I i I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I i M I I I I I I I I I 
CATACGGATTCCAATACTCTCCTGGACAGCGGGTCGAGTTCCTGGTGAATGCCTGG 
SYGFQYSPGQRVEFLVNAW 



CDS : polyprotein 
Query 

Sbjct 



[Hep 2629 AKKCPMGFAYDTRCFDSTV 
8227 CGAAGAAATGCCCTATGGGCTTCGCATATGACACCCGCTGTTTTGACTCAACGGTC 
I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7259 CGAAGAAATGCCCTATGGGCTTCGCATATGACACCCGCTGTTTTGACTCAACGGTC 
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CDS: non-structural p 1820 

CDSrpolyprotein [Hep 2649 

Query 8287 

Sbjct 7319 

CDS : non-structural p 1840 



K K 



A 



V 



ENDIRVEESIYQCCDLAPE 
AGAATGACATCCGTGTTGAGGAGTCAATCTACCAATGTTGTGACTTGGCCCCCGAA 
I I I I I I I I I I I I I I I I I I t 1 I I I i I I I I I I I i M i I { I I I I I I I I I I I I I I I I I I { 
AG7VATGACATCCGTGTTGAGGAGTCAATCTACCAATGTTGTGACTTGGCCCCCGAA 
ENDIRVEESIYQCCDLAPE 



CDS:polyprotein [Hep 2669 

Query 8347 

Sbjct 7379 

CDS: non-structural p 1860 



RQAIRS LTERLYIGGPLTN 
GACAGGCCATAAGGTCGCTCACAGAGCGGCTTTACATCGGGGGCCCCCTGACTAAT 
I I I I I I I I M I I I i I 1 I I I I I I I I I I I I I M I I I I I M i I I I I I I I I I I I I I I I 1 I 
GACAGGCCATAAGGTCGCTCACAGAGCGGCTTTACATCGGGGGCCCCCTGACTAAT 
RQAIRSLTERLYIGGPLTN 



CDSrpolyprotein [Hep 2689KGQNCGYRRCRASGVLTTS 
Query 84 07 AAGGGCAG7VACTGCGGCTATCGCCGGTGCCGCGCGAGCGGTGTACTGACGACCAGC 

I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I M I I I I 
74 39 AAGGGCAGAACTGCGGCTATCGCCGGTGCCGCGCGAGCGGTGTACTGACGACCAGC 



Sbjct 

CDS: non-structural p 1880 K G Q N C G 



R R C R A S 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



2709 GNTLTCYLKAAAACRAAKL 
84 67 GTAATACCCTCACATGTTACTTGAAGGCCGCTGCGGCCTGTCGAGCTGCGAAGCTC 
I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
74 99 GTAATACCCTCACATGTTACTTGAAGGCCGCTGCGGCCTGTCGAGCTGCGAAGCTC 
1900 GNTLTCYLKAAAACRAAKL 



CDS: polyprotein [Hep 2729 

Query 8527 

Sbjct 7559 

CDS: non-structural p 1920 



DCTMLVCGDDLVVICESAG 
ACTGCACGATGCTCGTATGCGGAGACGACCTTGTCGTTATCTGTGAAAGCGCGGGG 
I I I I I I M I I I I I I I I M I I I I I I I I I I I M I I M I I M I I I I I I I I I I I I I I I M 

ACTGCACGATGCTCGTATGCGGAGACGACCTTGTCGTTATCTGTGAAAGCGCGGGG 
DCTMLVCGDDLVVICE SAG 



CDS: polyprotein [Hep 274 9 

Query 8587 

Sbjct 7619 

CDS: non-structural p 1940 



QEDEASLRAFTEAMTRYSA 
AAGAGGACGAGGCGAGCCTACGGGCCTTCACGGAGGCTATGACTAGATACTCTGCC 
I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I II I I M I M I I I I I I I I I I I I I I I I I 
T^GAGGACGAGGCGAGCCTACGGGCCTTCACGGAGGCTATGACTAGATACTCTGCC 
QEDEASLRAFTEAMTRYSA 



CDS : polyprotein [Hep 27 69 

Query 8647 

Sbjct 7 67 9 

CDS :non- structural p 1960 



PGDPPKPEYDLELITSCSS 
CTGGGGACCCGCCCAAACCAGAATACGACTTGGAGTTGATAACATCATGCTCCTCC 
I I II II II I I II I II II I II I I I I I I I I I I I II I II II I II II I I I II I I I I II II 
CTGGGGACCCGCCC/^AACCAGAATACGACTTGGAGTTGATAACATCATGCTCCTCC 
PGDPPKPEYDLELITSCSS 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



2789 VSVAHDASGKRVYYLTRDP 
8707 TGTCAGTCGCGCACGATGCATCTGGCAA7U\GGGTGTACTATCTCACCCGTGACCCC 
I I II II I I I I I I I I I II I I I I I I I I I I I I II II II I I I I II I I I I I I I I I I I I I II 
7739 TGTCAGTCGCGCACGATGCATCTGGCAAAAGGGTGTACTATCTCACCCGTGACCCC 
1980 VSVAHDASGKRVYYLTRDP 



CDS: polyprotein [Hep 2809 

Query 8767 

Sbjct 7799 

CDS: non-structural p 2000 



TPLARAAWETARHTPVNSW 
CCCCCCTTGCGCGGGCTGCGTGGGAGACAGCTAGACACACTCCAGTCAATTCCTGG 
I II II II I I I I I I I I I II I I I I I I I I I I I I II I I I II I II I M I I I I I I I I I I I II 
CCCCCCTTGCGCGGGCTGCGTGGGAGACAGCTAGACACACTCCAGTCAATTCCTGG 
TPLARAAWETARHTPVNSW 



CDS: polyprotein [Hep 2829 
Query 8827 

Sbjct 7859 



GNIIMYAPTLWARMILMTH 
GCAACATCATCATGTATGCGCCCACCTTGTGGGCAAGGATGATCCTGATGACTCAT 

I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I M I II M I I I I I I I I I I I I I I I I I 
GCAACATCATCATGTATGCGCCCACCTTGTGGGCAAGGATGATCCTGATGACTCAT 
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CDS: non-structural p 2020 GNI IMYAPTLWARMILMTH 



CDS : polyprotein [Hep 

Query 

Sbjct 

CDS :non- structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



2849 FSILLAQEQLEKALDCQIY 
8887 TCTCCATCCTTCTAGCTCAGGAACAACTTGAAAAAGCCCTAGATTGTCAGATCTAC 
I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7 919 TCTCCATCCTTCTAGCTCAGGAACAACTTGAAAAAGCCCTAGATTGTCAGATCTAC 
2040 FSILLAQEQLEKALDCQIY 

2869 ACYSIEPLDLPQIIQRLHG 
894 7 CCTGTTACTCCATTGAGCCACTTGACCTACCTCAGATCATTCAACGACTCCATGGC 

I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I 
7 97 9 CCTGTTACTCCATTGAGCCACTTGACCTACCTCAGATCATTCAACGACTCCATGGC 
2060 ACYSIEPLDLPQIIQRLHG 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS :non- structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS :non- structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS :non- structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS :non- structural p 



2889 SAFSLHSYSPGEINRVASC 
9007 GCGCATTTTCACTCCATAGTTACTCTCCAGGTGAGATCAATAGGGTGGCTTCATGC 
I I I I I I I I i i I I I I I I I I i I I I I I I I I I I I I I i i i I i I I I I I I I I I I I I I I I I I I I 
8039 GCGCATTTTCACTCCATAGTTACTCTCCAGGTGAGATCAATAGGGTGGCTTCATGC 
2080 SAFSLHSYSPGEINRVASC 

2909 RKLGVPPLRVWRHRARSVR 
9067 GGAAACTTGGGGTACCGCCCTTGCGAGTCTGGAGACATCGGGCCAGAAGTGTCCGC 
I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
8099 GGAAACTTGGGGT ACCGCCCTTGCGAGTCTGGAGACATCGGGCCAGAAGTGTCCGC 
2100 RKLGVPPLRVWRHRARSVR 

2929 RLLSQGGRAATCGKYLFNW 
9127 GGCTACTGTCCCAGGGGGGGAGGGCTGCCACTTGTGGCAAGTACCTCTTCAACT GG 
I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

815 9 GGCTACTGTCCCAGGGGGGGAGGGCTGCCACTTGTGGCAAGTACCTCTTCAACTGG 
2120 RLLSQGGRAATCGKYLFNW 

2949 VRTKLKLTPI PAASQLDLS 
9187 TAAGGACCAAGCTCAAACTCACTCCAATCCCGGCTGCGTCCCAGTTGGATTTATCC 
I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I } 
8219 TAAGGACCAAGCTCAAACTCACTCCAATCCCGGCTGCGTCCCAGTTGGATTTATCC 
2140 VRTKLKLTPIPAASQLDLS 

2969 WFVAGYSGGDIYHSLSRAR 
924 7 GGTTCGTTGCTGGTTACAGCGGGGGAGACATATATCACAGCCTGTCTCGTGCCCGA 
I I I I I I I M M I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I M I M I I I I I I I 
827 9 GGTTCGTTGCTGGTTACAGCGGGGGAGACATATATCACAGCCTGTCTCGTGCCCGA 
2160 WFVA'GYSGGDIYHSLSRAR 

2989 RWFMWCLLLLSVGVGIYLL 

9307 GCTGGTTCATGTGGTGCCTACTCCTACTTTCTGTAGGGGTAGGCATCTATCTACTC 

. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I N I I I I I I I I I I 

8339 GCTGGTTCATGTGGTGCCTACTCCTACTTTCTGTAGGGGTAGGCATCTATCTACTC 

2180 RWFMWCL LLLSVGVGIYLL 

3009 N R 

9367 ACCGATGAACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTG 9412 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 

83 99 ACCGATGAACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTG 
2200 N R 



8444 
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Score = 696 bits (362), Expect = 0.0 
Identities = 2ie/31S (100%), Gaps = 0/376 (0%) 
Strand=Plus/Plus 



Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 
Query 
Sbjct 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS:core-neo fusion 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS;core-neo fusion 



2 
2 

62 
62 
122 



182 



182 



242 



CCAGCCCCCGATTGGGGGCGACACTCCACCATAGATCACTCCCCTGTGAGGAACTAC 
I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCAGCCCCCGATTGGGGGCGACACTCCACCATAGATCACTCCCCTGTGAGGAACTAC 

CTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGG 



CCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
122 CCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCC 



ACGACCGGGTCCTTTCTTGGATCAACCCGCTC/^TGCCTGGAGATTTGGGCGTGCCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGACCGGGTCCTTTCTTGGATCAACCCGCTCAATGCCTGGAGATTTGGGCGTGCCC 



CGAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATA 
I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
242 CGAGACTGCTAGCCGAGTAGTGTTGGGTCGCGATVAGGCCTTGTGGTACTGCCTGATA 

1 M S T N P K 

302 TGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACCATGAGCACGAATCCTAA 
I I I M M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
302 TGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACCATGAGCACGAATCCTAA 
1 M S T N P K 

8 Q R K T K 

362 TCAAAGAAAAACCAAA 377 

IIIIIIIIIMIIIM 
362 TCAAAGAAAAACCAAA 377. 
8 Q R K T K 



Score = 189 bits (98), Expect = 2e-43 
Identities = 98/98 (100%), Gaps = 0/98 (0%) 
Strand=Plus/Plus 

Query 9508 GGTGGCTCCATCTTAGCCCTAGTCACGGCTAGCTGTGAAAGGTCCGTGAGCCGCTTGACT 9567 

IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIMIIIIIIIIIIIIIIII 
Sbj Ct 854 0 GGTGGCTCCATCTTAGCCCTAGTCACGGCTAGCTGTGAAAGGTCCGTGAGCCGCTTGACT 8599 

Query 9568 GCAGAGAGTGCTGATACTGGCCTCTCTGCAGATCAAGT 9605 

MMMIIIIIIIIIMMIIMIIIIIIIIIMIIII 

Sbjct 8600 GCAGAGAGTGCTGATACTGGCCTCTCTGCAGATCAAGT 8637 



CPU time: 0.15 user sees. 0.04 sys . sees 0.19 total sees. 
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PubMed 



^ Blast 2 Sequences results 

Entrez BLAST OMIM Taxonomy 



Structure 



BLAST 2 SEQUENCES RESULTS VERSION BLASTN 2.2.17 [Aug-26-2007] 

MatchilT" "] Mis match:| -2 j ga p open:|5 j gap extension: j? | 

x_dropoff: |0 1 expect:ilO:OOo5 wordsize: \l] j Filter B View option [Standard 



Masking character option )X for protein, n for nucleotide jg| Masking color option |Black] 
B Show CDS translation 



Sequence 1 : gi | 5420376|Hepatitis C virus type lb complete genome, isolate Conl 
Length = 9604 (1 ..9605) 

Sequence 2: gi | 5441840|Hepatitis C virus replicon I389/NS3~3'UTR 
Length = 8000 (1 ..8001) 




NOTE:Bitscore and expect value are calculated based on the size of the nr database. 



NOTE:If protein translation is reversed, please repeat the search with reverse strand of the query 
sequence. 



Score. = 1.142e+04 bits (5937), Expect = 0.0 
Identities = 5993/5993 (100%), Gaps = 0/5993 (0%) 
Strand=Plus/Plus 



CDS:polyprotein [Hep 1027 

Query 3420 

Sbjct 1816 

CDS: non-structural p 2 



APITAYS QQTRGLLGCI I T 
GCGCCTATTACGGCCTACTCCCAACAGACGCGAGGCCTACTTGGCTGCATCATCAC 
I I I I I I I I I I I I I I I I t I I I I I I I I I I i I 1 I I I i I I I I I I I I I I I I I I I I I I I I I I 
GCGCCTATTACGGCCTACTCCCAACAGACGCGAGGCCTACTTGGCTGCATCATCAC 

APITAYSQQTRGLLGCIIT 



CDS rpolyprotein [Hep 
Query 

Sbjct 



1047 LTGRDRNQVEGEVQVVSTA 
3480 CTCACAGGCCGGGACAGGAACCAGGTCGAGGGGGAGGTCCJ\AGTGGTCTCCACCGC 
I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1876 CTCACAGGCCGGGACAGGAACCAGGTCGAGGGGGAGGTCCAAGTGGTCTCCACCGC 
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CDS: non-structural p 22 



G R 



N 



G E V Q 



T A 



CDS:polyprotein [Hep 1067 

Query 3540 

Sbjct 1936 

CDS : non-structural p 42 



QSFLATCVNGVCWTVYHGA 
CAATCTTTCCTGGCGACCTGCGTCAATGGCGTGTGTTGGACTGTCTATCATGGTGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAATCTTTCCTGGCGACCTGCGTCJ\ATGGCGTGTGTTGGACTGTCTATCATGGTGC 

QSFLATCVNGVCWTVYHGA 



CDS ipolyprotein [Hep 1087 

Query 3600 

Sbjct 1996 

CDS : non-structural p 62 



SKTLAGPKGPITQMYTNVD 
TCAAAGACCCTTGCCGGCCCAAAGGGCCCAATCACCCAAATGTACACCAATGTGGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCAAAGACCCTTGCCGGCCCA7\AGGGCCCAATCACCCAAATGTACACCAATGTGGA 

SKTLAGPKGPITQMYTNVD 



CDS:polyprotein [Hep 1107 

Query 3660 

Sbjct 2056 

CDS : non-structural p 82 



DLVGWQAPPGARSLTPCTC 
GACCTCGTCGGCTGGCAAGCGCCCCCCGGGGCGCGTTCCTTGACACCATGCACCTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACCTCGTCGGCTGGCAAGCGCCCCCCGGGGCGCGTTCCTTGACACCATGCACCTG 

DLVGWQAPPGARSLTPCTC 



CDS ipolyprotein [Hep 1127 

Query 3720 

Sbjct 2116 

CDS: non-structural p 102 



SSDLYLVTRHADVI PVR RR 
AGCTCGGACCTTTACTTGGTCACGAGGCATGCCGATGTCATTCCGGTGCGCCGGCG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

AGCTCGGACCTTTACTTGGTCACGAGGCATGCCGATGTCATTCCGGTGCGCCGGCG 
SSDLYLV TRHADVI PVRRR 



CDS ipolyprotein [Hep 1147 

Query 3780 

Sbjct 2176 

CDS: non-structural p 122 



DSRGSLLSPRPVSY LKGS S 
GACAGCAGGGGGAGCCTACTCTCCCCCAGGCCCGTCTCCTACTTGAAGGGCTCTTCG 
I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I 
GACAGCAGGGGGAGCCTACTCTCCCCCAGGCCCGTCTCCTACTTGAAGGGCTCTTC 

DS RGS LLS PR PVS Y LKG S S 



CDS ipolyprotein [Hep 1167 

Query 3840. 

Sbjct 2236 

CDS I non-structural p 142 



GPLLCPSGHAVGIFRAAVC 

GGTCCACTGCTCTGCCCCTCGGGGCACGCTGTGGGCATCTTTCGGGCTGCCGTGTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTCCACTGCTCTGCCCCTCGGGGCACGCTGTGGGCATCTTTCGGGCTGCCGTGTG 
GPLLCPSGHAVGI FRAAVC 



CDS ipolyprotein [Hep 1187 

Query 3900 

Sbjct 2296 

CDS I non-structural p 162 



RGVAKAVDFVPVESMETTM 
CGAGGGGTTGCGAAGGCGGTGGACTTTGTACCCGTCGAGTCTATGGAAACCACTAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGAGGGGTTGCGAAGGCGGTGGACTTTGTACCCGTCGAGTCTATGGAAACCACTAT 

RGVAKAVDFVPVESMETTM 



CDS ipolyprotein [Hep 1207 

Query 3960 

Sbjct 2356 

CDS I non-structural p 182 



SPVFTDNSSPPAV PQTFQV 
TCCCCGGTCTTCACGGACAACTCGTCCCCTCCGGCCGTACCGCAGACATTCCAGGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCCCGGTCTTCACGGACAACTCGTCCCCTCCGGCCGTACCGCAGACATTCCAGGT 

SPVFTDNSSPPAVPQTFQV 



CDS ipolyprotein [Hep 
Query 

Sbjct 

CDS I non-structural p 



1227 HLHAPTGSGKSTKVPAAYA 
4020 CATCTACACGCCCCTACTGGTAGCGGCAAGAGCACTAAGGTGCCGGCTGCGTATGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2416 CATCTACACGCCCCTACTGGTAGCGGCAAGAGCACTAAGGTGCCGGCTGCGTATGC 
202 HLHAPTGSGKSTKVPAAYA 



CDS ipolyprotein [Hep 1247 
Query 4080 

Sbjct 2476 



QGYKVLVLNPSVAATLGFG 
CAAGGGTATAAGGTGCTTGTCCTGAACCCGTCCGTCGCCGCCACCCTAGGTTTCGG 

I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
CAAGGGTATAAGGTGCTTGTCCTGAACCCGTCCGTCGCCGCCACCCTAGGTTTCGG 
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CDS: non-structural p 222 



K 



N 



A A T 



CDSrpolyprotein [Hep 1267 

Query 4140 

Sbjct 2536 

CDS: non-Structural p 242 



YMSKAHGIDPNIRTGVRTI 
TATATGTCTAAGGCACATGGTATCGACCCTAACATCAGAACCGGGGTAAGGACCAT 
I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
TATATGTCTAAGGCACATGGTATCGACCCTAACATCAGJ\ACCGGGGTAAGGACCAT 

YMSKAHGIDPNIRTGVRTI 



CDS:polyprotein [Hep 12 87 

Query 4200 

Sbjct 2596 

CDS: non-structural p 262 



TGAPITYSTYGKFLADGGC 
ACGGGTGCCCCCATCACGTACTCCACCTATGGCAAGTTTCTTGCCGACGGTGGTTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGGGTGCCCCCATCACGTACTCCACCTATGGCAAGTTTCTTGCCGACGGTGGTTG 

TGAPITYSTYGKFLADGGC 



CDS:polyprotein [Hep 1307 

Query 4260 

Sbjct ^ 2656 

CDS: non-structural p 282 



GGAYDIIICDECHSTDSTT 
GGGGGCGCCTATGACATCATAATATGTGATGAGTGCCACTCAACTGACTCGACCAC 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGGGCGCCTATGACATCATAATATGTGATGAGTGCCACTCAACTGACTCGACCAC 
GGAYDIIICDECHSTDSTT 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



1327 LGIGTVLDQAETAGARLVV 
4320 CTGGGCATCGGCACAGTCCTGGACCAAGCGGAGACGGCTGGAGCGCGACTCGTCGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

2716 CTGGGCATCGGCACAGTCCTGGACCAAGCGGAGACGGCTGGAGCGCGACTCGTCGT 
302 LGI GTVLDQAETAGARLVV 



CDS:polyprotein [Hep 1347 



Query 
Sbjct 

CDS: non-structural p 



ATATPPGSVTVPHPNIEEV 
4380 GCCACCGCTACGCCTCCGGGATCGGTCACCGTGCCACATCCAAACATCGAGGAGGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2776 GCCACCGCTACGCCTCCGGGATCGGTCACCGTGCCACATCCAAACATCGAGGAGGT 
322 ATATPPGSVTVPHPNIEEV 



CDS:polyprotein [Hep 1367 

Query 4440 

Sbjct 2836 

CDS: non-structural p 342 



LSSTGEIPFYGKAIPIETI 
CTGTCCAGCACTGGAGAAATCCCCTTTTATGGCAAAGCCATCCCCATCGAGACCAT 
i I i I I I M I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I M I 

CTGTCCAGCACTGGAGAAATCCCCTTTTATGGCAAAGCCATCCCCATCGAGACCAT 
LSSTGEIPFYGKAIPIETI 



CDS:polyprotein [Hep 1387 

Query 4500 

Sbjct 2896 

CDS : non-structural p 362 



GGRHLIFCHSKKKCDELAA 
GGGGGGAGGCACCTCATTTTCTGCCATTCCAAGAAGAAATGTGATGAGCTCGCCGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I 
GGGGGGAGGCACCTCATTTTCTGCCATTCCAAGAAGAAATGTGATGAGCTCGCCGC 

GGRHLIFCHSKKKCDELAA 



CDS:polyprotein [Hep 1407 

Query 4560 

Sbjct 2956 

CDS: non-structural p 382 



LSGLGLNAVAYYRGLDVSV 
CTGTCCGGCCTCGGACTCAATGCTGTAGCATATTACCGGGGCCTTGATGTATCCGT 

I I I I II II I II II I II I II I I II I II I I II II II I I II II I I II II II II M I II I 
CTGTCCGGCCTCGGACTCAATGCTGTAGCATATTACCGGGGCCTTGATGTATCCGT 
LSGLGLNAVAYYRGLDVSV 



CDS:polyprotein [Hep 1427 

Query 4620 

Sbjct 3016 

CDS: non-structural p 402 



PTSGDVIVVATDALMTGFT 
CCAACTAGCGGAGACGTCATTGTCGTAGCAACGGACGCTCTAATGACGGGCTTTAC 
II I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 
CCAACTAGCGGAGACGTCATTGTCGTAGCAACGGACGCTCTAATGACGGGCTTTAC 

PTS GDVIVVA TDALMTGFT 



CDS:polyprotein [Hep 1447 
Query 4680 

Sbjct 3076 



DFDSVIDCNTCVTQTVDFS 
GATTTCGACTCAGTGATCGACTGCAATACATGTGTCACCCAGACAGTCGACTTCAG 

I II I I I I I II I I I I I I II I I I I I I I II I I I I I I I 11 I I I I I I II I I II I I I I II I I 
GATTTCGACTCAGTGATCGACTGCAATACATGTGTCACCCAGACAGTCGACTTCAG 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 422 



N 



CDS:polyprotein [Hep 1467 

Query 4740 

Sbjct 3136 

CDS : non-structural p 442 

CDS rpolyprotein [Hep 1487 

Query 4800 

Sbjct 3196 

CDS: non-structural p 462 

CDS:polyprotein [Hep 1507 

Query 4860 

Sbjct 3256 

CDS : non-structural p 482 

CDS:polyprotein [Hep 1527 

Query 4920 

Sbjct 3316 

CDS: non-structural p 502 

CDS rpolyprotein [Hep 1547 

Query 4980 

Sbjct 3376 

CDS: non-structural p 522 

CDS:polyprotein [Hep 1567 

Query 5040 

Sbjct 3436 

CDS: non-structural p 542 

CDS rpolyprotein [Hep 1587 

Query 5100 

Sbjct 3496 

CDS: non-structural p 562 



DPTFTIETTTVPQDAVSRS 
GACCCGACCTTCACCATTGAGACGACGACCGTGCCACAAGACGCGGTGTCACGCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACCCGACCTTCACCATTGAGACGACGACCGTGCCACAAGACGCGGTGTCACGCTC 

DPTFTIETTTVPQDAVSRS 

RRGRTGRGRMGIYRFVTPG 
CGGCGAGGCAGGACTGGTAGGGGCAGGATGGGCATTTACAGGTTTGTGACTCCAGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGGCGAGGCAGGACTGGTAGGGGCAGGATGGGCATTTACAGGTTTGTGACTCCAGG 

RRGRTGRGRMGIYRFVTPG 

RPSGMFDSSVLCECYDAGC 
CGGCCCTCGGGCATGTTCGATTCCTCGGTTCTGTGCGAGTGCTATGACGCGGGCTG 
I I I I M I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGGCCCTCGGGCATGTTCGATTCCTCGGTTCTGTGCGAGTGCTATGACGCGGGCTG 
RPSGMFDSSVLCECYDAGC 

WYELTPAETSVRLRAYLNT 
TGGTACGAGCTCACGCCCGCCGAGACCTCAGTTAGGTTGCGGGCTTACCTA7\ACAC 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGTACGAGCTCACGCCCGCCGAGACCTCAGTTAGGTTGCGGGCTTACCTAAACAC 
WYELTPAETSVRLRAYLNT 

GLPVCQDHLEFWESVFTGL 
GGGTTGCCCGTCTGCCAGGACCATCTGGAGTTCTGGGAGAGCGTCTTTACAGGCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGTTGCCCGTCTGCCAGGACCATCTGGAGTTCTGGGAGAGCGTCTTTACAGGCCT 

GL PVCQDH LEFWESVFTGL 

HIDAHFLSQTKQAGD .NFPY 
CACATAGACGCCCATTTCTTGTCCCAGACTAAGCAGGCAGGAGACAACTTCCCCTA 
M I I M I I I I I I I I I I I I I I I I I I I M I I I I I 1 I I I I I I I I I I I I I I I 1 I I I I I I I 
CACATAGACGCCCATTTCTTGTCCCAGACTAAGCAGGCAGGAGACAACTTCCCCTA 

HIDAHFLSQTKQ AGDNFPY 

VAYQATVCARAQAPPPSWD 
GTAGCATACCAGGCTACGGTGTGCGCCAGGGCTCAGGCTCCACCTCCATCGTGGGA 
I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTAGCATACCAGGCTACGGTGTGCGCCAGGGCTCAGGCTCCACCTCCATCGTGGGA 

VAYQATVCARAQAP P PSWD 



CDS : polyprotein [Hep 

Query 

Sbjct 

CDS : non-structural p 



1607 MWKCLIRLKPTLHGPTPLL 
5160 ATGTGGAAGTGTCTCATACGGCTAAAGCCTACGCTGCACGGGCCAACGCCCCTGCT 
I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I 
3556 ATGTGGAAGTGTCTCATACGGCTAAAGCCTACGCTGCACGGGCCAACGCCCCTGCT 
582 MWKCLIRLKPTLHGPTPLL 



CDS: polyprotein [Hep 1627 

Query 5220 

Sbjct 3616 

CDS: non-structural p 602 



RLGAVQNEVT TTHPI TKY I 
AGGCTGGGAGCCGTTCAAAACGAGGTTACTACCACACACCCCATAACCAAATACAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M 

AGGCTGGGAGCCGTTCAAAACGAGGTTACTACCACACACCCCATAACCAAATACAT 
RLGAVQNE VTTTHPITKYI 



CDS: polyprotein [Hep 1647 
Query 5280 

Sbjct 3676 



ACMSADLEVVTSTWVLVGG 
GCATGCATGTCGGCTGACCTGGAGGTCGTCACGAGCACCTGGGTGCTGGTAGGC GG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCATGCATGTCGGCTGACCTGGAGGTCGTCACGAGCACCTGGGTGCTGGTAGGCGG 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?l 



10/18/07 



CDS : non-structural p 622 



C M 



A D 



V V T 



T W V L V G G 



CDS :polyprotein [Hep 1667 

Query 5340 

Sbjct 3736 

CDS: non-structural p 642 



LAALAAY C L T T GS VV I V GR 
CTAGCAGCTCTGGCCGCGTATTGCCTGACAACAGGCAGCGTGGTCATTGTGGGCAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTAGCAGCTCTGGCCGCGTATTGCCTGACAACAGGCAGCGTGGTCATTGTGGGCAG 

LAALAAYCLTTGSVVI VGR 



CDSrpolyprotein [Hep 1687 

Query 5400 

Sbjct 3796 

CDS : non-structural p 662 



I LSGK PAI I PDREVLYRE F 
ATCTTGTCCGG7\AAGCCGGCCATCATTCCCGACAGGGAAGTCCTTTACCGGGAGTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCTTGTCCGGAAAGCCGGCCATCATTCCCGACAGGGAAGTCCTTTACCGGGAGTT 

ILSGKPAIIPDREVLYREF 



CDSrpolyprotein [Hep 1707 

Query 5460 

Sbjct 3856 

CDS: non-structural p 682 



EMEECASHLPYIEQGMQLA 
GAGATGGAAGAGTGCGCCTCACACCTCCCTTACATCGAACAGGGAATGCAGCTCGC 
I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGATGGAAGAGTGCGCCTCACACCTCCCTTACATCGAACAGGGAATGCAGCTCGC 

EMEECASHLPYIEQGMQLA 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



1727 QFKQKAI GLLQTATKQAEA 
5520 CAATTCA7\ACAGAAGGCAATCGGGTTGCTGCAAACAGCCACCAAGCAAGCGGAGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3916 CAATTCAAACAGAAGGCAATCGGGTTGCTGCAAACAGCCACCAAGCAAGCGGAGGC 
702 QFKQKAIGL LQTATKQAEA 



CDS:polyprotein [Hep 1747 

Query 5580 

Sbjct 3976 

CDS: non-structural p 722 



APVVESKWRTLEAFWAKHM 
GCTCCCGTGGTGGAATCCAAGTGGCGGACCCTCGAAGCCTTCTGGGCGAAGCATAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCTCCCGTGGTGGAATCCAAGTGGCGGACCCTCGAAGCCTTCTGGGCGAAGCATAT 

APVVESKWRTLEAFWAKHM 



CDSrpolyprotein [Hep 17 67 

Query 5640 

Sbjct 4036 

CDS : non-structural p 742 



NFISGIQYLAGLSTLPGNP 
AATTTCATCAGCGGGATACAATATTTAGCAGGCTTGTCCACTCTGCCTGGCAACCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

AATTTCATCAGCGGGATACAATATTTAGCAGGCTTGTCCACTCTGCCTGGCAACCC 
NFISGIQYLAGLSTLPGNP 



CDSrpolyprotein [Hep 1787 

Query 5700 

Sbjct 4096 

CDS r non-structural p 7 62 



lASLMAFTASITSPLTTQH 
ATAGCATCACTGATGGCATTCACAGCCTCTATCACCAGCCCGCTCACCACCCAACA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATAGCATCACTGATGGCATTCACAGCCTCTATCACCAGCCCGCTCACCACCCAACA 
lASLMAFTASITSPLTTQH 



CDSrpolyprotein [Hep 1807 

Query 5760 

Sbjct 4156 

CDS : non-structural p 782 



LLFNILGGWVAAQLAPPSA 
CTCCTGTTTAACATCCTGGGGGGATGGGTGGCCGCCCAACTTGCTCCTCCCAGCGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCCTGTTTAACATCCTGGGGGGATGGGTGGCCGCCCAACTTGCTCCTCCCAGCGC 

LLFNI LGGWVAAQLAP PSA 



CDSrpolyprotein [Hep 1827 

Query 5820 

Sbjct 4216 

CDS: non-structural p 802 



SAFVGAGIAGAAVGS I GLG 
TCTGCTTTCGTAGGCGCCGGCATCGCTGGAGCGGCTGTTGGCAGCATAGGCCTTGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

TCTGCTTTCGTAGGCGCCGGCATCGCTGGAGCGGCTGTTGGCAGCATAGGCCTTGG 
SAFVG AGIAGAAVGS I GLG 



CDSrpolyprotein [Hep 1847 
Query 5880 

Sbjct 4276 



VLVDI LAGYGAGVAGALVA 

GTGCTTGTGGATATTTTGGCAGGTTATGGAGCAGGGGTGGCAGGCGCGCTCGTGGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGCTTGTGGATATTTTGGCAGGTTATGGAGCAGGGGTGGCAGGCGCGCTCGTGGC 



http://Avww.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?l 



10/18/07 



CDS : non-structural p 822 



LAG 



A G A 



V 



CDS:polyprotein [Hep 1867 

Query 5940 

Sbjct 4336 

CDS: non-structural p 842 



KVMSGEMPSTEDLVNLLPA 
AAGGTCATGAGCGGCGAGATGCCCTCCACCGAGGACCTGGTTAACCTACTCCCTGC 
I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGGTCATGAGCGGCGAGATGCCCTCCACCGAGGACCTGGTTAACCTACTCCCTGC 

KVMSGEMPSTEDLVNLLPA 



CDS:polyprotein [Hep 18 87 

Query 6000 

Sbjct 4396 

CDS: non-structural p 862 



LSPGALVVG VVCAAILRRH 
CTCTCCCCTGGCGCCCTAGTCGTCGGGGTCGTGTGCGCAGCGATACTGCGTCGGCA 
I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCTCCCCTGGCGCCCTAGTCGTCGGGGTCGTGTGCGCAGCGATACTGCGTCGGCA 

LS PG.ALVVGVVCAAI LRRH 



CDS :polyprotein [Hep 1907 

Query 6060 

Sbjct 4456 

CDS: non-structural p 882 



GPGEGAVQWMNRLIAFASR 
GGCCCAGGGGAGGGGGCTGTGCAGTGGATGAACCGGCTGATAGCGTTCGCTTCGCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCCCAGGGGAGGGGGCTGTGCAGTGGATGAACCGGCTGATAGCGTTCGCTTCGCG 

GPGEGAVQWMNRLIAFASR 



CDS:polyprotein [Hep 1927 

Query 6120 

Sbjct 4516 

CDS: non-structural p 902 



NHVS PTHYV PE S DAAARV T 
AACCACGTCTCCCCCACGCACTATGTGCCTGAGAGCGACGCTGCAGCACGTGTCAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACCACGTCTCCCCCACGCACTATGTGCCTGAGAGCGACGCTGCAGCACGTGTCAC 
NHVSPTHYVPESDAAARVT 



CDS :polyprotein [Hep 1947 

Query 6180 

Sbjct 4576 

CDS: non-structural p 922 

CDS:polyprotein [Hep 1967 

Query 6240 

Sbjct 4636 

CDS: non-structural p 942 



ILS SLTITQLLKRLHQWIN 
ATCCTCTCTAGTCTTACCATCACTCAGCTGCTGAAGAGGCTTCACCAGTGGATCAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCCTCTCTAGTCTTACCATCACTCAGCTGCTGAAGAGGCTTCACCAGTGGATCAA 

ILSSLTITQLLKRLHQWIN 

DCSTPCSGSWLRDVWD.WIC 
GACTGCTCCACGCCATGCT'CCGGCTCGTGGCTAAGAGATGTTTGGGATTGGATATG 
I I I M I I I M I I I I I I I I i I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
GACTGCTCCACGCCATGCTCCGGCTCGTGGCTAAGAGATGTTTGGGATTGGATATG 

DCSTPCSGSWLRDVWDWIC 



CDSrpolyprotein [Hep 1987 

Query 6300 

Sbjct 4696 

CDS: non-structural p 962 



VLTDFKTWLQSKLLPRLPG 
GTGTTGACTGATTTCAAGACCTGGCTCCAGTCCAAGCTCCTGCCGCGATTGCCGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGTTGACTGATTTCAAGACCTGGCTCCAGTCCAAGCTCCTGCCGCGATTGCCGGG 

VLTDFKTWLQSKLLPRLPG 



CDS:polyprotein [Hep 2007 

Query 6360 

Sbjct 4756 

CDS: non-structural p 982 



PFFSCQRGYKGVWRGDGIM 
CCCTTCTTCTCATGTCAACGTGGGTACTUVGGGAGTCTGGCGGGGCGACGGCATCAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
CCCTTCTTCTCATGTCAACGTGGGTACAAGGGAGTCTGGCGGGGCGACGGCATCAT 
PFFSCQRGYKGVWRGDGIM 



CDS:polyprotein [Hep 2027 
Query 



Sbjct 

CDS: non-structural p 



TTCPCGAQITGHVKNGSMR 
6420 ACCACCTGCCCATGTGGAGCACAGATCACCGGACATGTGA7\/\AACGGTTCCATGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4816 ACCACCTGCCCATGTGGAGCACAGATCACCGGACATGTGAAAAACGGTTCCATGAG 
1002 TTCPCGAQITGHVKNGSMR 



CDS:polyprotein [Hep 2047 
Query 6480 

Sbjct 4876 



VGPRTCSNTWHGTFPINAY 
GTGGGGCCTAGGACCTGTAGTAACACGTGGCATGGAACATTCCCCATTAACGCGTA 
I I I I I I I I I li I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGGGGCCTAGGACCTGTAGTAACACGTGGCATGGJ\ACATTCCCCATTAACGCGTA 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS : non-structural p 1022 



N T W H G T 



NAY 



CDSipolyprotein [Hep 2067 

Query 6540 

Sbjct 4936 

CDS: non-structural p 1042 



TGPCTPSPAPNYSRALWRV 
ACGGGCCCCTGCACGCCCTCCCCGGCGCCAAATTATTCTAGGGCGCTGTGGCGGGT 
I I I I I I I I i I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGGGCCCCTGCACGCCCTCCCCGGCGCCAAATTATTCTAGGGCGCTGTGGCGGGT 

TGPCTPSPAPNYSRALWRV 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non-structural 



2087 AEEYVEVTRVGDFH.YVTGM 
6600 GCTGAGGAGTACGTGGAGGTTACGCGGGTGGGGGATTTCCACTACGTGACGGGCAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4996 GCTGAGGAGTACGTGGAGGTTACGCGGGTGGGGGATTTCCACTACGTGACGGGCAT 
1062 AEEYVEVTRVGDFHYVTGM 



CDSipolyprotein [Hep 2107 

Query 6660 

Sbjct 5056 

CDS: non-structural p 1082 



TDNVKCPCQVPAPEFFTEV 
ACTGACAACGTAAAGTGCCCGTGTCAGGTTCCGGCCCCCGAATTCTTCACAGAAGT 
I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACTGACAACGTAAAGTGCCCGTGTCAGGTTCCGGCCCCCGAATTCTTCACAGAAGT 

TDNVKCPCQVPAPEFFTE V 



CDSipolyprotein [Hep 2127 

Query 6720 

Sbjct 5116 

CDS: non-structural p 1102 



GVRLHRYAPACKPLLREEV 
GGGGTGCGGTTGCACAGGTACGCTCCAGCGTGCAAACCCCTCCTACGGGAGGAGGT 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGGGTGCGGTTGCACAGGTACGCTCCAGCGTGCAAACCCCTCCTACGGGAGGAGGT 
GVR LHRYAPACKPLLREEV 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non-structural p 



2147 FLVGLNQYLVGSQLPCEPE 
6780 TTCCTGGTCGGGCTCAATCAATACCTGGTTGGGTCACAGCTCCCATGCGAGCCCGA 
I I I I I I I I I I i i I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I 
5176 TTCCTGGTCGGGCTCAATCAATACCTGGTTGGGTCACAGCTCCCATGCGAGCCCGA 
1122 FLVGLNQYLVGSQLPCEPE 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-Structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-Structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



2167 DVAVLTSMLTDPS.H ITAE T 
6840 GACGTAGCAGTGCTCACTTCCATGCTCACCGACCCCTCCCACATTACGGCGGAGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5236 GACGTAGCAGTGCTCACTTCCATGCTCACCGACCCCTCCCACATTACGGCGGAGAC 
1142 DVAVLTSMLTDPSHITAET 

2187 KRRLARGSPPSLASSSASQ 
6900 AAGCGTAGGCTGGCCAGGGGATCTCCCCCCTCCTTGGCCAGCTCATCAGCTAGCCA 
I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5296 AAGCGTAGGCTGGCCAGGGGATCTCCCCCCTCCTTGGCCAGCTCATCAGCTAGCCA 
1162 KRRLARGSPPSLASSSASQ 

2207 SAPSLKATCTTRHDSPDAD 
6960 TCTGCGCCTTCCTTGAAGGCAACATGCACTACCCGTCATGACTCCCCGGACGCTGA 
I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5356 TCTGCGCCTTCCTTGAAGGCAACATGCACTACCCGTCATGACTCCCCGGACGCTGA 
1182 SAPSLKATCTTRHDSPDAD 

2227 lEANLLWRQEMGGNITRVE 
7020 ATCGAGGCCAACCTCCTGTGGCGGCAGGAGATGGGCGGGAACATCACCCGCGTGGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5416 ATCGAGGCCAACCTCCTGTGGCGGCAGGAGATGGGCGGGAACATCACCCGCGTGGA 
1202 lE ANLLWRQEMGGNITRVE 



CDS : polyprotein 
Query 

Sbjct 



[Hep 2247 ENKVVILDSFEPLQAEEDE 
7080 GAAAATAAGGTAGTAATTTTGGACTCTTTCGAGCCGCTCCAAGCGGAGGAGGATGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5476 GAA7\ATAAGGT AGTAATTTTGGACTCTTTCGAGCCGCTCCAAGCGGAGGAGGAT GA 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS : non-structural p 1222 



N K V V 



Q A E 



CDS:polyprotein [Hep 2267 

Query 7140 

Sbjct 5536 

CDS: non-Structural p 1242 



EVSVPAEILRRSRKFPRAM 
GAAGTATCCGTTCCGGCGGAGATCCTGCGGAGGTCCAGGAAATTCCCTCGAGCGAT 
I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAGTATCCGTTCCGGCGGAGATCCTGCGGAGGTCCAGGA7\ATTCCCTCGAGCGAT 

EVSVPAEILRRSRKFPRAM 



CDSrpolyprotein [Hep 22 87 

Query 7200 

Sbjct 5596 

CDS: non-structural p 1262 



IWARPDYNPPLLESWKDPD 
ATATGGGCACGCCCGGATTACAACCCTCCACTGTTAGAGTCCTGGAAGGACCCGGA 
I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATATGGGCACGCCCGGATTACAACCCTCCACTGTTAGAGTCCTGGAAGGACCCGGA 

IWARPDYNPPLLESWKDPD 



CDS:polyprotein [Hep 2307 

Query 7260 

Sbjct 5656 

CDS: non-structural p 1282 



VPPVVHGCPLPPAKAPPI P 
GTCCCTCCAGTGGTACACGGGTGTCCATTGCCGCCTGCCAAGGCCCCTCCGATACC 
I I I I I I I i I I I I I I I M I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTCCCTCCAGTGGTACACGGGTGTCCATTGCCGCCTGCCAAGGCCCCTCCGATACC 

VPPVVHGCPLPPAKAPPIP 



CDS:polyprotein [Hep 2327 

Query 7320 

Sbjct 5716 

CDS: non-structural p 1302 



PRRKRTVVLSESTV SSALA 
CCACGGAGGAAGAGGACGGTTGTCCTGTCAGAATCTACCGTGTCTTCTGCCTTGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCACGGAGGAAGAGGACGGTTGTCCTGTCAGAATCTACCGTGTCTTCTGCCTTGGC 

PRRKRTVVLSESTVSSALA 



CDS:polyprotein [Hep 2347 

Query 7380 

Sbjct 5776 

CDS: non-structural p 1322 



LATKTFGSSESSAVDSGTA 
CTCGCCACAAAGACCTTCGGCAGCTCCGAATCGTCGGCCGTCGACAGCGGCACGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCGCCACAAAGACCTTCGGCAGCTCCGAATCGTCGGCCGTCGACAGCGGCACGGC 

LATKTFGSSESSAVDSGTA 



CDS : polyprotein [ Hep 
Query 

Sbjct 

CDS : non-structural p 



2367 ASPDQPSDDGDAGSDVESY 
7440 GCCTCTCCTGACCAGCCCTCCGACGACGGCGACGCGGGATCCGACGTTGAGTCGTA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5836 GCCTCTCCTGACCAGCCCTCCGACGACGGCGACGCGGGATCCGACGTTGAGTCGTA 
1342 ASPDQPSDDGDAGSDVESY 



CDS: polyprotein [Hep 2387 

Query 7500 

Sbjct 5896 

CDS : non-structural p 1362 



SMPPLEGEPGDPDLSDGSW 
TCCATGCCCCCCCTTGAGGGGGAGCCGGGGGATCCCGATCTCAGCGACGGGTCTTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCATGCCCCCCCTTGAGGGGGAGCCGGGGGATCCCGATCTCAGCGACGGGTCTTG 

SMPPLEGEPGDPDLSDGSW 



CDS: polyprotein [Hep 2407 

Query 7560 

Sbjct 5956 

CDS: non-structural p 1382 



TVSEEASEDVVCCSMSYTW 
ACCGTAAGCGAGGAGGCTAGTGAGGACGTCGTCTGCTGCTCGATGTCCTACACATG 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I M I I I I I I I I I I 

ACCGTAAGCGAGGAGGCTAGTGAGGACGTCGTCTGCTGCTCGATGTCCTACACATG 
TVSEEASEDVVCCSMSYTW 



CDS: polyprotein [Hep 2427 

Query 7620 

Sbjct 6016 

CDS: non-structural p 1402 



GALITPCAAEETKLPINAL 
GGCGCCCTGATCACGCCATGCGCTGCGGAGGAAACCAAGCTGCCCATCAATGCACT 

I I I I I I I I I I I I I I M I I I I M M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
GGCGCCCTGATCACGCCATGCGCTGCGGAGGAAACCAAGCTGCCCATCAATGCACT 
GALITPCAAEETKLPINAL 



CDS : polyprotein [Hep 2447 
Query 7680 

Sbjct 6076 



NSLLRHHNLVYATTSRSAS 
AACTCTTTGCTCCGTCACCACAACTTGGTCTATGCTACAACATCTCGCAGCGCAAG 
i I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACTCTTTGCTCCGTCACCACAACTTGGTCTATGCTACAACATCTCGCAGCGCTUVG 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2xgi?l 



10/18/07 



CDS: non-structural p 1422 



N 



H H N 



A T 



S A S 



CDSrpolyprotein [Hep 2467 



Query 
Sbjct 

CDS : non-Structural p 



RQKKVTFDRLQVLDDHYRD 
7740 CGGCAGAAGAAGGTCACCTTTGACAGACTGCAGGTCCTGGACGACCACTACCGGGA 
. I I I I I I I I I I I I 1 I 1 I I I I I I I I I i 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6136 CGGCAGAAGAAGGTCACCTTTGACAGACTGCAGGTCCTGGACGACCACTACCGGGA 
1442 RQKKVTFDRLQVLDDHYRD 



CDSrpolyprotein [Hep 2487 

Query 7800 

Sbjct 6196 

CDS: non-structural p 1462 



LKEMKAKASTVKAKLLSVE 
CTCAAGGAGATGAAGGCGAAGGCGTCCACAGTTAAGGCTAAACTTCTATCCGTGGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCAAGGAGATGAAGGCGAAGGCGTCCACAGTTAAGGCTAAACTTCTATCCGTGGA 

LKEMKAKASTVKAKLLSVE 



CDS:polyprotein [Hep 2507 

Query 7860 

Sbjct 6256 

CDS: non-structural p 1482 

CDSrpolyprotein [Hep 2527 

Query 7920 

Sbjct 6316 

CDS: non-structural p 1502 

CDSrpolyprotein [Hep 2547 

Query 7980 

Sbjct 6376 

CDS: non-structural p 1522 

CDS:polyprot.ein [Hep 2567 

Query 8040 

Sbjct 6436 

CDS: non-structural p 1542 



ACKLTPPHSARSKFGYGAK 
GCCTGTAAGCTGACGCCCCCACATTCGGCCAGATCTAAATTTGGCTATGGGGCAAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCTGTAAGCTGACGCCCCCACATTCGGCCAGATCTAAATTTGGCTATGGGGCAAA 

ACKLTPPHSARSKFGYGAK 

VRNLSSKAVNHIRSVWKDL 
GTCCGGAACCTATCCAGCAAGGCCGTTAACCACATCCGCTCCGTGTGGAAGGACTT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

GTCCGGAACCTATCCAGCAAGGCCGTTAACCACATCCGCTCCGTGTGGAAGGACTT 
VRNLSSKAVNHI RSVWKDL 

EDTETPIDTTIMAKNEVFC 
GAAGACACTGAGACACCAATTGACACCACCATCATGGCAAAAAATGAGGTTTTCTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAGACACTGAGACACCAATTGACACCACCATCATGGCA/\7W\ATGAGGTTTTCTG 

EDTETPIDTTIMAKNEVFC 

QPEKGGRKPARLIVFPDLG 

CAACCAGAGAAGGGGGGCCGCAAGCCAGCTCGCCTTATCGTATTCCCAGATTTGGG 
I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAACCAGAGAAGGGGGGCCGCAAGCCAGCTCGCCTTATCGTATTCCCAGATTTGGG 
QPEKGGRKPARLIVFPDLG 



CDS:polyprotein [Hep 2587 

Query 8100 

Sbjct 6496 

CDS: non-structural p 1562 



RVCEKMALYDVVSTLPQAV 
CGTGTGTGCGAGAAAATGGCCCTTTACGATGTGGTCTCCACCCTCCCTCAGGCCGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGTGTGTGCGAGA7WVTGGCCCTTTACGATGTGGTCTCCACCCTCCCTCAGGCCGT 

RVCEKMALYDVVSTLPQAV 



CDSrpolyprotein [Hep 2607 

Query 8160 

Sbjct . 6556 

CDS : non-structural p 1582 



GSSYGFQYSPGQRVEFLVN 
GGCTCTTCATACGGATTCCAATACTCTCCTGGACAGCGGGTCGAGTTCCTGGTGAA 

I I I I I I I I I I I I I I I I I I M I I I M M I I I I I I I I I I I M I I I M I I I I I I M I I I 
GGCTCTTCATACGGATTCCAATACTCTCCTGGACAGCGGGTCGAGTTCCTGGTGAA 
GSSYGFQYSPGQRVEFLVN 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



2627 WKAKKCPMGFAYDTRCFDS 
8220 TGGAAAGCGAAGAAATGCCCTATGGGCTTCGCATATGACACCCGCTGTTTTGACTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

6616 TGGAAAGCGAAGA7\ATGCCCTATGGGCTTCGCATATGACACCCGCTGTTTTGACTC 
1602 WKAKKCPMGFAYDTRCFDS 



CDS:polyprotein [Hep 2647 
Query 8280 

Sbjct 6676 



VTENDIRVEESIYQCCDLA 
GTCACTGAGAATGACATCCGTGTTGAGGAGTCAATCTACCAATGTTGTGACTTGGC 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTCACTGAGAATGACATCCGTGTTGAGGAGTCAATCTACCAATGTTGTGACTTGGC 



http ://www. ncbi .nlni. nih.gov/BL AST/bl2seq/wblast2 . cgi? 1 



10/18/07 



CDS: non-structural p 1622 V T E N 



R V 



CDSrpolyprotein [Hep 2667 

Query 8340 

Sbjct 6736 

CDS: non-structural p 1642 



EARQAIRSLTERLYIG GPL 
GAAGCCAGACAGGCCATAAGGTCGCTCACAGAGCGGCTTTACATCGGGGGCCCCCT 
I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAGCCAGACAGGCCATAAGGTCGCTCACAGAGCGGCTTTACATCGGGGGCCCCCT 

EARQAIRSLTERLYIGGPL 



CDSrpolyprotein [Hep 2 687 

Query 8400 

Sbjct 6796 

CDS : non-structural p 1662 



NSKGQNCGYRRCRASGVLT 
AATTCTAAAGGGCAGAACTGCGGCTATCGCCGGTGCCGCGCGAGCGGTGTACTGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AATTCTAAAGGGCAGAACTGCGGCTATCGCCGGTGCCGCGCGAGCGGTGTACTGAC 

NSKGQNCGYRRCRASGVLT 



CDSipolyprotein [Hep 2707 

Query 8460 

Sbjct 6856 

CDS: non-structural p 1682 

CDS:polyprotein [Hep 2727 

Query 8520 

Sbjct 6916 

CDS: non-structural p 1702 

CDS:polyprotein [Hep 2747 

Query 8580 

Sbjct 6976 

CDS: non-structural p 1722 

CDS:polyprotein [Hep 27 67 

Query 8640 

Sbjct 7036 

CDS: non-structural p 1742 

CDSrpolyprotein [Hep 2787 

Query 8700 

Sbjct 7096 

CDS: non-structural p 17 62 



SCGNTLTCYLKAAAACRAA 
AGCTGCGGTAATACCCTCACATGTTACTTGAAGGCCGCTGCGGCCTGTCGAGCTGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
AGCTGCGGTAATACCCTCACATGTTACTTGAAGGCCGCTGCGGCCTGTCGAGCTGC 

SCGNTLTCYLKAAAACRAA 

LQDCTMLVCGDDLVVICES 
CTCCAGGACTGCACGATGCTCGTATGCGGAGACGACCTTGTCGTTATCTGTGAAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I 
CTCCAGGACTGCACGATGCTCGTATGCGGAGACGACCTTGTCGTTATCTGTGAAAG 

LQDCTMLVCGDDLVVICES 

GTQEDEASLRAFTEAMTRY 
GGGACCCAAGAGGACGAGGCGAGCCTACGGGCCTTCACGGAGGCTATGACTAGATA 
I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGACCCAAGAGGACGAGGCGAGCCTACGGGCCTTCACGGAGGCTATGACTAGATA 

GTQE DEASLRAFTEAMTRY 

APP GDPPKPEYDLELITSC 
GCCCCCCCTGGGGACCCGCCCAAACCAGAATACGACTTGGAGTTGATAACATCATG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCCCCCCTGGGGACCCGCCCAAACCAG7\ATACGACTTGGAGTTGATAACATCATG 

APPGDPPKPEYDLELITSC 

SNVSVAHDASGKRVYYLTR 
TCCAATGTGTCAGTCGCGCACGATGCATCTGGCAAAAGGGTGTACTATCTCACCCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCAATGTGTCAGTCGCGCACGATGCATCTGGCAAAAGGGTGTACTATCTCACCCG 

SNVSVAHDASGKRVYYLTR 



CDS:polyprotein [Hep 2807 

Query 8760 

Sbjct 7156 

CDS: non-structural p 1782 



PTT PL.ARAAWE TARHT PVN 
CCCACCACCCCCCTTGCGCGGGCTGCGTGGGAGACAGCTAGACACACTCCAGTCAA 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

CCCACCACCCCCCTTGCGCGGGCTGCGTGGGAGACAGCTAGACACACTCCAGTCAA 
PTTPLARAAWETARHTPVN 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



2827 WLGNIIMYAPTLWARMILM 
8820 TGGCTAGGCAACATCATCATGTATGCGCCCACCTTGTGGGCAAGGATGATCCTGAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7216 TGGCTAGGCAACATCATCATGTATGCGCCCACCTTGTGGGCAAGGATGATCCTGAT 
1802 WLGNI IMYAPTLWARMILM 



CDSrpolyprotein [Hep 2847 
Query 8880 

Sbjct 7276 



HFFSILLAQEQL.EKALDCQ 
CATTTCTTCTCCATCCTTCTAGCTCAGGAACAACTTGAA7\AAGCCCTAGATTGTCA 
I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CATTTCTTCTCCATCCTTCTAGCTCAGGAACAACTTGAAAAAGCCCTAGATTGTCA 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 1822 



H 



L A Q E Q 



K A 



Q 



CDSrpolyprotein [Hep 2867 
Query 



8940 



7336 



Sbjct 

CDS: non-structural p 1842 



YGACYSIEPLDLP. QIIQRL 
TACGGGGCCTGTTACTCCATTGAGCCACTTGACCTACCTCAGATCATTCAACGACT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TACGGGGCCTGTTACTCCATTGAGCCACTTGACCTACCTCAGATCATTCAACGACT 

YGACYSIEPLDLPQIIQRL 



CDSipolyprotein [Hep 2887 
Query 



9000 



7396 



Sbjct 

CDS : non-structural p 1862 



GLSAFSLHSYSPGEINRVA 
GGCCTTAGCGCATTTTCACTCCATAGTTACTCTCCAGGTGAGATCAATAGGGTGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCCTTAGCGCATTTTCACTCCATAGTTACTCTCCAGGTGAGATCAATAGGGTGGC 

GLSAFS LHS Y S PGE INRVA 



CDSrpolyprotein [Hep 2907 

Query 9060 

Sbjct 7456 

CDS : non-structural p 1882 



CLRKLGVPPLRVWRHRARS 
TGCCTCAGGAAACTTGGGGTACCGCCCTTGCGAGTCTGGAGACATCGGGCCAGAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I 
TGCCTCAGGAAACTTGGGGTACCGCCCTTGCGAGTCTGGAGACATCGGGCCAGAAG 

CLRKLGVPPLRVWRHRARS 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



2927 RARLLSQGGRAATCGKYLF 
9120 CGCGCTAGGCTACTGTCCCAGGGGGGGAGGGCTGCCACTTGTGGCAAGTACCTCTT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7516 CGCGCTAGGCTACTGTCCCAGGGGGGGAGGGCTGCCACTTGTGGCAAGTACCTCTT 
1902 RARLLSQGGRAATCGKYLF 



CDS:polyprotein [Hep 2947 

Query 9180 

Sbjct 7576 

CDS: non-structural p 1922 



WAVRTKLKLTPI PAASQLD 
TGGGCAGTAAGGACCAAGCTCAAACTCACTCCAATCCCGGCTGCGTCCCAGTTGGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGGCAGTAAGGACCAAGCTCAAACTCACTCCAATCCCGGCTGCGTCCCAGTTGGA 

WAVRTKLKLTPI PAASQLD 



CDS:polyprotein [Hep 2967 

Query 9240 

Sbjct 7636 

CDS: non-structural p 1942 



SSWFVAGYSGGDIYHSLSR 
TCCAGCTGGTTCGTTGCTGGTTACAGCGGGGGAGACATATATCACAGCCTGTCTCG 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCAGCTGGTTCGTTGCTGGTTACAGCGGGGGAGACATATATCACAGCCTGTCTCG 
SSWFVAGYSGGDIYHSLSR 



CDSipolyprotein [Hep 2987 

Query 9300 

Sbjct 7696 

CDS : non-structural p 1962 



RPRWFMWCLLLLSVGVGIY 
CGACCCCGCTGGTTCATGTGGTGCCTACTCCTACTTTCTGTAGGGGTAGGCATCTA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGACCCCGCTGGTTCATGTGGTGCCTACTCCTACTTTCTGTAGGGGTAGGCATCTA 

RPRWFMWCLLLLSVGVGIY 



CDSipolyprotein [Hep 3007 

Query 9360 

Sbjct 7756 

CDS: non-structural p 1982 



L P N R 

CTCCCCAACCGATG7\ACGGGGAGCTJ\AACACTCCAGGCCAATAGGCCATCCTG 9 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

CTCCCCAACCGATGAACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTG 7 
L P N R 



Score = 719 bits (374)^ Expect =0.0 
Identities = 388/388 (100%), Gaps = 0/388 (0%) 
Strand=Plus/Plus 



http://www,ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?l 



10/18/07 



Query 






2 


CCAGCCCCCGATTGGGGGCGACACTCCACCATAGATCACTCCCCTGTGAGGAACTAC 










1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 i M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 i 1 M 1 t I 1 1 1 M 1 1 1 


Sb j ct 






2 




Query 






62 


CTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGG 










1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 


Sbjct 






62 


CT T C AC GCAGAAAGC GT CT AGC CAT GGC GT T A GT AT G AGT GT C GT GP fi GP PT P f ZX fza 


Query 






122 


CCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCC 










1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t t 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 > 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 f 1 1 1 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Sbjct 






122 


CCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACPGGAATTGPP 


Query 






182 


ACGACCGGGTCCTTTCTTGGATCAACCCGCTCAATGCCTGGAGATTTGGGCGTGCCC 










1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ir 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 i 


Sbjct 






182 


ACGACCGGGT CCTTT CTT GGATCAACCCGCT C AAT GP PT (^f^a(^aTTTr;f;f^Pr:Tf::P P P 


Query 






242 


CGAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATA 










1 1 1 1 1 1 1 1 1 1 1 1 i i 1 t i 1 1 1 1 1 1 1 1 I 1 1 1 1 i 1 1 M 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
>> 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 t 1 1 


Sbjct 






242 


C GAGAP T GP T AGP P G A GT A GT GT T t^nnT P nP riZX Zi Zi n/ZP PTT riT rz/tiT" 2\ P T P P P T» r* IX "P n 


CDS : polyprotein 




1 


M q rp Ki p v 


Query 






302 


TGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACCATGAGCACGAATCCTAA 










1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 


Sbjct 






302 


T GPTT GP G A GT t^P P P P f^rif^ A (^HT PT P riT A <t:zx P P rtin zx n p zx r* n r* n r* A n 


CDS :core-neo 


fusion 




"W C "NT "D V 


CDS : polyprotein 


[Hep 


3 




Query 






362 


TPAAAf^AAAAAPPA A APr^TA APZXrr'ZXZXr* "500 










1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Sbjct 






362 


TCAAAGAAAAACCAAACGTAACACC7\AC 389 


CDS : core-neo 


fusion 


8 


Q RKTKRNTN 



Score = 189 bits (98), Expect = 2e-43 
Identities = 98/98 (100%), Gaps = 0/98 (0%) 
Strand=Plus/Plus 



Query 9508 

Sbjct 7904 

Query 9568 

Sbjct 7964 



GGTGGCTCCATCTTAGCCCTAGTCACGGCTAGCTGTGAAAGGTCCGTGAGCCGCTTGACT 9567 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M' I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTGGCTCCATCTTAGCCCTAGTCACGGCTAGCTGTGAAAGGTCCGTGAGCCGCTTGACT 7963 

GC AGAGAGT GCT GAT ACT GGC CT CT CT GCAGAT CAAGT 9605 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I hi 
GCAGAGAGTGCTGATACTGGCCTCTCTGCAGATCAAGT 8001 



CPU time: 0.15 user sees. 0.05 sys. sees 0.20 total sees. 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



Blast 2 Sequences results 



PubMed 



Entrez 



BLAST 



OMIM 



Taxonomy 



Structure 



BLAST 2 SEQUENCES RESULTS VERSION BLASTN 2.2a7 [Aug-26-2007] 



Match:[r~l Mismatch:|;;;2 J J gap open:|5 I gap extension: [2 



x_dropoff: | 0 \ expect:|lO:OOOOwordsize: [ll ] Filter B View option { Stand ard 



Masking color option 



Masking character option I^J^^LP'^o^?!!?*^^^^^^^^^ 
B Show CDS translation BS 



Black i 



Sequence 1: gi | 54203 76 [Hepatitis C virus type lb complete genome, isolate Conl 
Length = 9604(1 ..9605) 

Sequence 2: gi|5441837 | Hepatitis C virus replicon I389/NS2-3^UTR 
Length = 8648 (1 ..8649) 



a. 




NOTE:Bitscore and expect value are calculated based on the size of the nr database. 



NOTE:If protein translation is reversed, please repeat the search with reverse strand of the query 
sequence. 



Score = 1.261e+04 bits (6560), Expect =0.0 
Identities = 6646/6646 (100%), Gaps = 0/6646 (0%) 
Strand=Plus/ Plus 

CDSrpolyprotein [Hep 809 AMDREMAAS CGGAV FVGL I 
Query - 2767 CCATGGACCGGGAGATGGCAGCATCGTGCGGAGGCGCGGTTTTCGTAGGTCTGATA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j C t 1811 CCATGGACCGGGAGATGGCAGCATCGTGCGGAGGCGCGGTTTTCGTAGGTCTGATA 

CDS: non-structural pi . MDREMAASCGGAVFVGLI 

CDSrpolyprotein [Hep 82 9 LTLSPHYKLFLARLIWWLQ 
Query 2827 TGACCTTGTCACCGCACTATAAGCTGTTCCTCGCTAGGCTCATATGGTGGTTACAA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I 
Sbjct 1871 TGACCTTGTCACCGCACTATAAGCTGTTCCTCGCTAGGCTCATATGGTGGTTACAA 



http://www.ncbi,nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 20 



H 



K 



A R 



W W 



CDSrpolyprotein [Hep 849 

Query 2887 

Sbjct 1931 

CDS: non-structural p 40 



FITRAEAHLQVWIPPLNVR 

TTATCACCAGGGCCGAGGCACACTTGCAAGTGTGGATCCCCCCCCTCAACGTTCGG 
M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTATCACCAGGGCCGAGGCACACTTGCAAGTGTGGATCCCCCCCCTCAACGTTCGG 
FITRAEAHLQVWI PPLNVR 



CDSrpolyprotein [Hep 869 

Query 2947 

Sbjct 1991 

CDS : non-structural p 60 



GRDAVILLTCAIHPELIFT 
GCCGCGATGCCGTCATCCTCCTCACGTGCGCGATCCACCCAGAGCTAATCTTTACC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I 
GCCGCGATGCCGTCATCCTCCTCACGTGCGCGATCCACCCAGAGCTAATCTTTACC 
GRDAVILLTCAIHPELIFT 



CDSrpolyprotein [Hep 889 

Query 3007 

Sbjct 2051 

CDS: non-structural p 80 



TKILLAILGPLMVLQAGIT 
CCAAAATCTTGCTCGCCAT ACTC GGT CCACT CAT GGT GCTCCAGGCT GGTATAACC 
II II I I I I I I I I I I II I I I I I I II II I I I II I I I I i II II II I 11 II I I I I I I M I 

CCAAAATCTTGCTCGCCATACTCGGTCCACTCATGGTGCTCCAGGCTGGTATAACC 
TKILLAILGPLMVLQAGIT 



CDSrpolyprotein [Hep 909 
Query 



Sbjct 

CDS: non-structural p 



VPYFVRAHGLIRACMLVRK 
3067 TGCCGTACTTCGTGCGCGCACACGGGCTCATTCGTGCATGCATGCTGGTGCGGAAG 

I II M I M II I I I I I I I I II II I I I I M I 11 I I I I I I I I I I I I I I I I I I I I I I II I 

2111 TGCCGTACTTCGTGCGCGCACACGGGCTCATTCGTGCATGCATGCTGGTGCGGAAG 
100 VPYFVRAHGLIRACMLVRK 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS: non-structural p 



929 AGGHYVQMALMKLAALTGT 
3127 CTGGGGGTCATTATGTCCAAATGGCTCTCATGAAGTTGGCCGCACTGACAGGTACGT 

i M I I I I I I II II 11 I I I I I I II I I I I I I I I 11 I I I I I II II I I I II I I I I I I I II 
2171 CTGGGGGTCATTATGTCCAAATGGCTCTCATGAAGTTGGCCGCACTGACAGGTACG 
120 AGGHYVQMALMKLAALTGT 



CDS: polyprotein [Hep 94 9 

Query 3187 

Sbjct 2231 

CDS : non-structural p 140 



VYDHLTPLRDWAHAGLRDL 
TTTATGACCATCTCACCCCACTGCGGGACTGGGCCCACGCGGGCCTACGAGACCTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTATGACCATCTCACCCCACTGCGGGACTGGGCCCACGCGGGCCTACGAGACCTT 
VYDHLTPLRDWAHAGLRD. L 



CDSrpolyprotein [Hep 969 

Query 3247 

Sbjct 2291 

CDS: non-structural p 160 



VAVEPVVFSDMETKVITWG 
TGGCAGTTGAGCCCGTCGTCTTCTCTGATATGGAGACCAAGGTTATCACCTGGGGG 
I I I II II I I II II I II II II I I II II I I I II II I I II II I II I I I I I I I I I I I I II 
TGGCAGTTGAGCCCGTCGTCTTCTCTGATATGGAGACCAAGGTTATCACCTGGGGG 
VAVEPVVFSDMETKVITWG 



CDSrpolyprotein [Hep 989 
Query 



Sbjct 

CDS: non-structural p 180 



DTAACGDIILGLPVSARRG 
3307 ACACCGCGGCGTGTGGGGACATCATCTTGGGCCTGCCCGTCTCCGCCCGCAGGGGG 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II II I M I I I I M M II I I I I I I I I 

2351 ACACCGCGGCGTGTGGGGACATCATCTTGGGCCTGCCCGTCTCCGCCCGCAGGGGG 
DTAACGDIILGLPVSARRG 



CDS r polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



1009 EIH LGPADSLEGQGWRLLA 
3367 AGATACATCTGGGACCGGCAGACAGCCTTGAAGGGCAGGGGTGGCGACTCCTCGCG 

I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II II II I I 
2411 AGATACATCTGGGACCGGCAGACAGCCTTGAAGGGCAGGGGTGGCGACTCCTCGCG 
200 EIHLGPADSLEGQGWRLLA 



CDSrpolyprotein [Hep 1029 
Query 3427 

Sbjct ^ 2471 



ITAYSQQTRGLLGCIITSL 
TTACGGCCTACTCCCAACAGACGCGAGGCCTACTTGGCTGCATCATCACTAGCCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II 
TTACGGCCTACTCCCAACAGACGCGAGGCCTACTTGGCTGCATCATCACTAGCCTC 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 220 



Q Q 



G L 



CDS:polyprotein [Hep 1049 

Query 3487 

Sbjct 2531 

CDS: non-structural p 240 

CDSrpolyprotein [Hep 1069 

Query 3547 

Sbjct 2591 

CDS: non-structural p 260 



GRDRNQVEGEVQVVSTATQ 

GCCGGGACAGGAACCAGGTCGAGGGGGAGGTCCAAGTGGTCTCCACCGCAACACAA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 1 n I I I I I I I I I I I I I I I I I I I I I I I 

GCCGGGACAGGAACCAGGTCGAGGGGGAGGTCCAAGTGGTCTCCACCGCAACACJ\A 
GRDRNQVEGEVQVVSTATQ 

FLATCVNGVCWTVYHGAGS 
TCCTGGCGACCTGCGTCAATGGCGTGTGTTGGACTGTCTATCATGGTGCCGGCTCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCTGGCGACCTGCGTCAATGGCGTGTGTTGGACTGTCTATCATGGTGCCGGCTCA 
FLATCVNGVCWTVYHGAGS 



CDS :polyprotein [Hep 1089 

Query 3607 

Sbjct 2651 

CDS : non-structural p 280 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



TLAGPKGPITQMYTNVDQD 
CCCTTGCCGGCCCAAAGGGCCCAATCACCCA7\ATGTACACCAATGTGGACCAGGAC 
I I I M I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
CCCTTGCCGGCCCAAAGGGCCCAATCACCCAAATGTACACCAATGTGGACCAGGAC 
TLAGPKGP ITQMYTNVDQD 



1109 VGWQAPPGARSLTPCTCGS 
3667 TCGGCTGGCAAGCGCCCCCCGGGGCGCGTTCCTTGACACCATGCACCTGCGGCAGC 
I I I I I I I I I I I I I I i i I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I i I I I I I I I I I 
2711 TCGGCTGGCAAGCGCCCCCCGGGGCGCGTTCCTTGACACCATGCACCTGCGGCAGC 
300 VGWQAPPGARSLTPCTCGS 



CDS :polyprotein [Hep 1129 

Query 3727 

Sbjct 2771 

CDS: non-structural p 320 

CDS:polyprotein [Hep 1149 

Query 3787 

Sbjct 2831 

CDS: non-structural p 340 



DLYLVTRHADVIPVRRRGD 
ACCTTTACTTGGTCACGAGGCATGCCGATGTCATTCCGGTGCGCCGGCGGGGCGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCTTTACTTGGTCACGAGGCATGCCGATGTCATTCCGGTGCGCCGGCGGGGCGAC 
DLYLVTRHADVIPVRRRGD 

RGSLLSPRPVSYLKGSSGG 
GGGGGAGCCTACTCTCCCCCAGGCCCGTCTCCTACTTGAAGGGCTCTTCGGGCGGT 
I I I I I I I I I I I I I I I I I I I I I I I II II I I M 1! I II I I II II II II II I I M II II 
GGGGGAGCCTACTCTCCCCCAGGCCCGTCTCCTACTTGAAGGGCTCTTCGGGCGGT 
RGSLLSPRPVSYLKGSSGG 



CDS :polyprotein [Hep 1169 

Query 3847 

Sbjct 2891 

CDS : non-structural p 360 



LLCPSGHAVGIFRAAVCTR 
TGCTCTGCCCCTCGGGGCACGCTGTGGGCATCTTTCGGGCTGCCGTGTGCACCCGA 

I II I II I II II I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

TGCTCTGCCCCTCGGGGCACGCTGTGGGCATCTTTCGGGCTGCCGTGTGCACCCGA 
LLCPSG HAVGI FRAAVCTR 



CDS:polyprotein [Hep 1189 

Query 3907 

Sbjct 2951 

CDS : non-structural p 380 



VAKAVDFVPVESMETTMRS 
TTGCGAAGGCGGTGGACTTTGTACCCGTCGAGTCTATGGAAACCACTATGCGGTCC 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTGCGAAGGCGGTGGACTTTGTACCCGTCGAGTCTATGGAAACCACTATGCGGTCC 
VAKAVDFVPVESMETTMRS 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 



1209 VFTDNSSPPAVPQTFQVAH 
3967 TCTTCACGGACAACTCGTCCCCTCCGGCCGTACCGCAGACATTCCAGGTGGCCCAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3011 TCTTCACGGACAACTCGTCCCCTCCGGCCGTACCGCAGACATTCCAGGTGGCCCAT 
400 VFTDNSSPPAVPQTFQVAH 

1229 HAPTGSGKSTKVPAAYAAQ 
4027 ACGCCCCTACTGGTAGCGGCAAGAGCACTAAGGTGCCGGCTGCGTATGCAGCCCAA 
I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I II II I II I I I I I I I I I 
3071 ACGCCCCTACTGGTAGCGGCAAGAGCACTAAGGTGCCGGCTGCGTATGCAGCCCAA 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?! 



10/18/07 



CDS: non-structural p 420 



HAP 



K S 



K 



P A A 



A Q 



CDS:polyprotein [Hep 1249 

Query 4087 

Sbjct 3131 

CDS: non-structural p 440 



YKVLVLNPSVAATLGFGAY 
ATAAGGTGCTTGTCCTGAACCCGTCCGTCGCCGCCACCCTAGGTTTCGGGGCGTAT 
I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I 
ATAAGGTGCTTGTCCTGAACCCGTCCGTCGCCGCCACCCTAGGTTTCGGGGCGTAT 
YKVLVLNPSVAATLGFGAY 



CDS:polyprotein [Hep 1269 

Query 4147 

Sbjct 3191 

CDS: non-structural p 460 



SKAHGIDPNIRTGVRTITT 
CTAAGGCACATGGTATCGACCCTAACATCAGAACCGGGGTAAGGACCATCACCACG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTAAGGCACATGGTATCGACCCTAACATCAGAACCGGGGTAAGGACCATCACCACG 
SKAHGIDPNIRTGVRTITT 



CDS:polyprotein [Hep 1289 

Query 4207 

Sbjct 3251 

CDS : non-structural p 480 



CDS:polyprotein [Hep 1309 
Query 



Sbjct 

CDS: non-structural p 500 



CDS:polyprotein [Hep 1329 

Query 4327 

Sbjct 3371 

CDS: non-structural p 520 



APITYSTYGKFLADGGCSG 
CCCCCATCACGTACTCCACCTATGGCAAGTTTCTTGCCGACGGTGGTTGCTCTGGG 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I 

CCCCCATCACGTACTCCACCTATGGCAAGTTTCTTGCCGACGGTGGTTGCTCTGGG 
APITYSTYGKFLADGGCSG 



AYDIIICDECHSTDSTTIL 
4267 CCTATGACATCATAATATGTGATGAGTGCCACTCAACTGACTCGACCACTATCCTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I M I M I I I I I I I I M I 

3311 CCTATGACATCATAATATGTGATGAGTGCCACTCAACTGACTCGACCACTATCCTG 
AYDIIICDECHSTDSTTIL 



I GTVLDQAETAGARLVVLA 
TCGGCACAGTCCTGGACCAAGCGGAGACGGCTGGAGCGCGACTCGTCGTGCTCGCC 
I i M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCGGCACAGTCCTGGACCAAGCGGAGACGGCTGGAGCGCGACTCGTCGTGCTCGCC 
I GTVLDQAETAGARLVVLA 



CDS:polyprotein [Hep 1349 

Query ' 4387 

Sbjct 3431 

CDS : non-structural p 540 



ATPPGSVT VPHPNIEEVAL 

CTACGCCTCCGGGATCGGTCACCGTGCCACATCCJWVCATCGAGGAGGTGGCTCTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I 

CTACGCCTCCGGGATCGGTCACCGTGCCACATCC7\7VACATCGAGGAGGTGGCTCTG 
ATPPGSVTVPHPNIEEVAL 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS: polyprotein [Hep 
Query 

Sbjct 



1369 STGEIPFYGKAIPIETIKG 
4447 GCACTGGAGAAATCCCCTTTTATGGCAAAGCCATCCCCATCGAGACCATCAAGGGG 
I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3491 GCACTGGAGAAATCCCCTTTTATGGCAAAGCCATCCCCATCGAGACCATCAAGGGG 
560 STGEIPFYGKAIPIETIKG 

1389 RHLI FCHSKKKCDELAAKL 
4507 GGCACCTCATTTTCTGCCATTCCAAGAAGAAATGTGATGAGCTCGCCGCGAAGCTG 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

3551 GGCACCTCATTTTCTGCCATTCCAAGAAGAAATGTGATGAGCTCGCCGCGAAGCTG 
580 RHL I FCHSKKKCDE LAAKL 

1409 GLGLNAVAYYRGLDVSVI P 
4567 GCCTCGGACTCAATGCTGTAGCATATTACCGGGGCCTTGATGTATCCGTCATACCA 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

3611 GCCTCGGACTCAATGCTGTAGCATATTACCGGGGCCTTGATGTATCCGTCATACCA 
600 GLGLNAVAYYRGLDVS VI P 

1429 SGDVIVVATDALMTGFTGD 
4627 GCGGAGACGTCATTGTCGTAGCAACGGACGCTCTAATGACGGGCTTTACCGGCGAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3671 GCGGAGACGTCATTGTCGTAGCAACGGACGCTCTAATGACGGGCTTTACCGGCGAT 



http://www.ncbi.nlm,nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 620 



G D V 



V A T D A L M 



G D 



CDS ipolyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



1449 DSVIDCNTCVTQTVDFSLD 
4687 ACTCAGTGATCGACTGCAATACATGTGTCACCCAGACAGTCGACTTCAGCCTGGAC 
I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3731 ACTCAGTGATCGACTGCAATACATGTGTCACCCAGACAGTCGACTTCAGCCTGGAC 
640 DSVIDCNTCVTQTVDFSLD 



CDS:polyprotein [Hep 1469 

Query 4747 

Sbjct 3791 

CDS: non-structural p 660 

CDSrpolyprotein [Hep 1489 

Query 4807 

Sbjct 3851 

CDS: non-structural p 680 



TFTIETTTVPQDAVSRSQR 
CCTTCACCATTGAGACGACGACCGTGCCACAAGACGCGGTGTCACGCTCGCAGCGG 
J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M ( 
CCTTCACCATTGAGACGACGACCGTGCCACJ\AGACGCGGTGTCACGCTCGCAGCGG 
TFTIETTTVPQDAVSRSQR 

GRTGRGRMGIYRFVTPGER 
GCAGGACTGGTAGGGGCAGGATGGGCATTTACAGGTTTGTGACTCCAGGAGAACGG 
I I I I I I I M I I I I I I I I I I I I I I I i I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I 
GCAGGACTGGTAGGGGCAGGATGGGCATTTACAGGTTTGTGACTCCAGGAGAACGG 
GRTGRGRMGIYRFVTPGER 



CDS :polyprotein 
Query 



[Hep 



Sbjct 

CDS: non-structural p 



1509 SGMFDSSVLCECYDAGCAW 
4867 CGGGCATGTTCGATTCCTCGGTTCTGTGCGAGTGCTATGACGCGGGCTGTGCTTGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3911 . CGGGCATGTTCGATTCCTCGGTTCTGTGCGAGTGCTATGACGCGGGCTGTGCTTGG 
700 SGMFDSSVLCECYDAGCAW 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



1529 ,ELTPAETSVRLRAYLNTPG 
4927 AGCTCACGCCCGCCGAGACCTCAGTTAGGTTGCGGGCTTACCTAAACACACCAGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3971 AGCTCACGCCCGCCGAGACCTCAGTTAGGTTGCGGGCTTACCTAAACACACCAGGG 
720 ELTPAETSVRLRAYLNTPG 



CDS: polyprotein [Hep 1549 

Query 4987 

Sbjct 4031 

CDS: non-structural p 740 



PVCQDHLEFWESVFTGLTH 
CCGTCTGCCAGGACCATCTGGAGTTCTGGGAGAGCGTCTTTACAGGCCTCACCCAC 
I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGTCTGCCAGGACCATCTGGAGTTCTGGGAGAGCGTCTTTACAGGCCTCACCCAC 
PVCQDHLE.FWESVFTGLTH 



CDS: polyprotein [Hep 1569 

Query 5047 

Sbjct 4091 

CDS: non-structural p 760 



DAHFLSQTKQAGDNFPYLV 
ACGCCCATTTCTTGTCCCAGACTAAGCAGGCAGGAGACAACTTCCCCTACCTGGTA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGCCCATTTCTTGTCCCAGACTAAGCAGGCAGGAGACAACTTCCCCTACCTGGTA 
D AHFLSQTKQAGDNFPYLV 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS: polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



1589 YQA TVCARAQAP P P SWDQM 
5107 ACCAGGCTACGGTGTGCGCCAGGGCTCAGGCTCCACCTCCATCGTGGGACCAAATG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

4151 ACCAGGCTACGGTGTGCGCCAGGGCTCAGGCTCCACCTCCATCGTGGGACCAAATG 
780 YQATVCARAQAPPPSWDQM 

1609 KCLIRLKPTLHGPTPLLYR 
5167 AGTGTCTCATACGGCTAAAGCCTACGCTGCACGGGCCAACGCCCCTGCTGTATAGG 

I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I 

4211 AGTGTCTCATACGGCTAAAGCCTACGCTGCACGGGCCAACGCCCCTGCTGTATAGG 
800 KCLIRLKPTLHGPTPL LYR 



CDS : polyprotein [Hep 
Query 

Sbjct 



1629 GAVQNEVTTTHPITKYIMA 
5227 GAGCCGTTCA7WVCGAGGTTACTACCACACACCCCATAACCAAATACATCATGGCA 
I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4271 GAGCCGTTCAAAACGAGGTTACTACCACACACCCCATAACCA7\ATACATCATGGCA 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2,cgi?l 



10/18/07 



CDS : non-structural p 820 



G A V 



N 



V T 



H 



K 



M 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non-structural 



1649 MSADLEVVTST. WVLVGGVL 
5287 TGTCGGCTGACCTGGAGGTCGTCACGAGCACCTGGGTGCTGGTAGGCGGAGTCCTA 
I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4331 TGTCGGCTGACCTGGAGGTCGTCACGAGCACCTGGGTGCTGGTAGGCGGAGTCCTA 
840 MSADLEVVTSTWVLVGGVL 

1669 ALAAYCLTTGSVVIVGRI I 
5347 CTCTGGCCGCGTATTGCCTGACAACAGGCAGCGTGGTCATTGTGGGCAGGATCATC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4391 CTCTGGCCGCGTATTGCCTGACAACAGGCAGCGTGGTCATTGTGGGCAGGATCATC 
860 ALAAYCLTTGSVVIVGRI I 



CDS: polyprotein [Hep 1689 

.Query 5407 

Sbjct 4451 

CDS: non-structural p 880 



SGKPAIIPDREVLYREFDE 
CCGGAAAGCCGGCCATCATTCCCGACAGGGAAGTCCTTTACCGGGAGTTCGATGAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I 
CCGGAAAGCCGGCCATCATTCCCGACAGGGAAGTpCTTTACCGGGAGTTCGATGAG 
SGKPAIIPDREVLYREFDE 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [ Hep 
Query 

Sbjct 

CDS : non-structural p 



1709 EECASHLPYIEQGMQLAEQ 
5467 AAGAGTGCGCCTCACACCTCCCTTACATCGAACAGGGAATGCAGCTCGCCGAACAA 

I I I I I I I I I I I I I I I I M I i I I I I I I I I I I I I I I I I I I I I I I 1 I M I i I I I I I I I I 

4511 AAGAGTGCGCCTCACACCTCCCTTACATCG7\ACAGGGAATGCAGCTCGCCGAACAA 
900 EECASHLPYIEQGMQLAEQ 



1729 
5527 

4571 
920 



CDS: polyprotein [Hep 1749 

Query 5587 

Sbjct 4631 

CDS: non-structural p 940 



KQKAI GLLQTATKQAEAAA 
AACAGAAGGCAATCGGGTTGCTGCAAACAGCCACCAAGCAAGCGGAGGCTGCTGCT 
I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACAGAAGGCAATCGGGTTGCTGCAAACAGCCACCAAGCAAGCGGAGGCTGCTGCT 
KQKAI GLLQT ATKQAEAAA 

VVESKWR TLEAFWAKHMWN 

TGGTGGAATCCAAGTGGCGGACCCTCGAAGCCTTCTGGGCGAAGCATATGTGGAAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGTGGAATCCAAGTGGCGGACCCTCGAAGCCTTCTGGGCGAAGCATATGTGGAAT 
VVESKWRTLEAFWAKHMWN 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 



1769 ISGIQYLAGLSTLPGNPAI 
5647 TCAGCGGGATACAATATTTAGCAGGCTTGTCCACTCTGCCTGGCAACCCCGCGATA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I 
4691 TCAGCGGGATACAATATTTAGCAGGCTTGTCCACTCTGCCTGGCAACCCCGCGATA 
960 ISGIQYLAGLSTLPGNPAI 

1789 SLMAFTASITSPLTTQHTL 
5707 CACTGATGGCATTCACAGCCTCTATCACCAGCCCGCTCACCACCCAACATACCCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4751 CACTGATGGCATTCACAGCCTCTATCACCAGCCCGCTCACCACCCAACATACCCTC 
980 SLMAFTASITSPLTTQHTL 

1809 FNI LGGWVAAQLAPPSAAS 
5767 TTAACATCCTGGGGGGATGGGTGGCCGCCCAACTTGCTCCTCCCAGCGCTGCTTCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4811 TTAACATCCTGGGGGGATGGGTGGCCGCCCAACTTGCTCCTCCCAGCGCTGCTTCT 
1000 FNILGGWVAAQ LAPPSAAS 

1829 FVGAGIAGAAVGSIGLGKV 
5827 TCGTAGGCGCCGGCATCGCTGGAGCGGCTGTTGGCAGCATAGGCCTTGGGAAGGTG 
I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I M I I I I 
4871 TCGTAGGCGCCGGCATCGCTGGAGCGGCTGTTGGCAGCATAGGCCTTGGGAAGGTG 



http://www.ncbi.nlIn.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 1020 F V G A G I 



A A V G 



G K 



CDS:polyprotein [Hep 1849 

Query 5887 

Sbjct 4931 

CDS: non-structural p 1040 



VDILAGYGAGVAGALVAFK 
TGGATATTTTGGCAGGTTATGGAGCAGGGGTGGCAGGCGCGCTCGTGGCCTTTAAG 
I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I i I I I I I I I I I I I I I I I M I I I I i I I 
TGGATATTTTGGCAGGTTATGGAGCAGGGGTGGCAGGCGCGCTCGTGGCCTTTAAG 
VDILAGYGAGVAGALVAFK 



CDS ipolyprotein [Hep 1869 

Query 5947 

Sbjct 4991 

CDS: non-structural p 1060 



MSGEMPSTEDLVNLLPAI L 
TGAGCGGCGAGATGCCCTCCACCGAGGACCTGGTTAACCTACTCCCTGCTATCCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGAGCGGCGAGATGCCCTCCACCGAGGACCTGGTTAACCTACTCCCTGCTATCCTC 
MSGEMPSTEDLVNLLPAIL 



CDS : polyprotein [Hep 

Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS: polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



1889 PGALVVGVVCAAILRRHVG 
6007 CTGGCGCCCTAGTCGTCGGGGTCGTGTGCGCAGCGATACTGCGTCGGCACGTGGGC 
I I I I I I I I I I I I I I I I I I I I I I I i I I I i I I I I I I I I I I I I I I I i I I I I I I I I I I I I 
5051 CTGGCGCCCTAGTCGTCGGGGTCGTGTGCGCAGCGATACTGCGTCGGCACGTGGGC 
1080 PGALVVGVVCAAI LRRHVG 

1909 GEGAVQWMNRLIAFASRGN 
6067 GGGAGGGGGCTGTGCAGTGGATGAACCGGCTGATAGCGTTCGCTTCGCGGGGTAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

5111 GGGAGGGGGCTGTGCAGTGGATGAACCGGCTGATAGCGTTCGCTTCGCGGGGTAAC 
1100 GEGAVQWMNRLIAFASRGN 

1929 VS PT HYV.PE S DAAARVTQ I 
6127 TCTCCCCCACGCACTATGTGCCTGAGAGCGACGCTGCAGCACGTGTCACTCAGATC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5171 TCTCCCCCACGCACTATGTGCCTGAGAGCGACGCTGCAGCACGTGTCACTCAGATC 
1120 VSPTHYVPESDAAARVTQI 

1949 SSLTITQLLKRLHQWINED 
6187 CTAGTCTTACCATCACTCAGCTGCTGAAGAGGCTTCACCAGTGGATCAACGAGGAC 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5231 CTAGTCTTACCATCACTCAGCTGCTGAAGAGGCTTCACCAGTGGATCAACGAGGAC 
1140 SSLTITQLLKRLHQWINED 

1969 STPCSGSWLRDVWDWI CTV 
6247 CCACGCCATGCTCCGGCTCGTGGCTAAGAGATGTTTGGGATTGGATATGCACGGTG 
I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
52 91 CCACGCCATGCTCCGGCTCGTGGCTAAGAGATGTTTGGGATTGGATATGCACGGTG 
1160 STPCSGSWLRDVWDWICTV 

1989 TDFKTWLQSKLLPRLPGVP 
6307 CTGATTTCAAGACCTGGCTCCAGTCCAAGCTCCTGCCGCGATTGCCGGGAGTCCCC 

I I I I I I I I II I I II I I II I II II I I M I I II II I II I I I II I I I I I II I I I I I I I I 

5351 CTGATTTCAAGACCTGGCTCCAGTCCAAGCTCCTGCCGCGATTGCCGGGAGTCCCC 
1180 TDFKTWLQSKLLPRLPGVP 

2009 FSCQRGYKGVWRGDGIMQT 
6367 TCTCATGTCAACGTGGGTACAAGGGAGTCTGGCGGGGCGACGGCATCATGCAT^ACC 

II I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I II II I II I I I II II I II I I 
5411 TCTCATGTCAACGTGGGTACAAGGGAGTCTGGCGGGGCGACGGCATCATGCAAACC 
1200 FSC QRGYKGVWRGDGIMQT 



CDS: polyprotein [Hep 2029 
Query 6427 

Sbjct 5471 



CPCGAQITGHVKNGSMRIV 
GCCCATGTGGAGCACAGATCACCGGACATGTGA7VAAACGGTTCCATGAGGATCGTG 
II I II II II I I I II I I I I I I I I I II I I I I I II II II II I I I II I II I I II I I II I I 
GCCCATGTGGAGCACAGATCACCGGACATGTGAAAAACGGTTCCATGAGGATCGTG 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 1220 C P C G A Q I 



G H 



K N 



M R 



CDS:polyprotein [Hep 2049 

Query 6487 

Sbjct 5531 

CDS: non-structural p 1240 



PRTCSNTWHGTFPINAYTT 
CTAGGACCTGTAGTAACACGTGGCATGGAACATTCCCCATTAACGCGTACACCACG 
I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTAGGACCTGTAGTAACACGTGGCATGGAACATTCCCCATTAACGCGTACACCACG 
PRTCSNTWHGTFPINAYTT 



CDS rpolyprotein [Hep 2069 

Query 6547 

Sbjct 5591 

CDS: non-structural p 1260 



PCT PSPAPNYSRALWRVAA 
CCTGCACGCCCTCCCCGGCGCCAAATTATTCTAGGGCGCTGTGGCGGGTGGCTGCT 
I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTGCACGCCCTCCCCGGCGCCAAATTATTCTAGGGCGCTGTGGCGGGTGGCTGCT 
PCTPS PAPNYSRALWRVAA 



CDS :polyprotein [Hep 2089 

Query 6607 

Sbjct 5651 

CDS : non-structural p 1280 



E YVEVTRVGDFHYVTGMTT 
AGTACGTGGAGGTTACGCGGGTGGGGGATTTCCACTACGTGACGGGCATGACCACT 
I I I .1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGTACGTGGAGGTTACGCGGGTGGGGGATTTCCACTACGTGACGGGCATGACCACT 
EYVEVT RVGDFHYVTGMTT 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 1300 N 



2109 NVKCPCQVPA PEFFTEVDG 
6667 ACGTAAAGTGCCCGTGTCAGGTTCCGGCCCCCGAATTCTTCACAGAAGTGGATGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

5711 ACGTAAAGTGCCCGTGTCAGGTTCCGGCCCCCGAATTCTTCACAGAAGTGGATGGG 



K 



A P 



CDS :polyprotein [Hep 2129 

Query 6727 

Sbjct 5771 

CDS: non-structural p 1320 



RLHRYAPACKPLLREEVT F 
GGTTGCACAGGTACGCTCCAGCGTGCAAACCCCTCCTACGGGAGGAGGTCACATTC 
I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTTGCACAGGTACGCTCCAGCGTGCAAACCCCTCCTACGGGAGGAGGTCACATTC 
RLHR YAPACKPLLREEVTF 



CDS:polyprotein [Hep 2149 

Query 6787 

Sbjct 5831 

CDS: non-structural p 1340 



VGLNQYLVGSQLPCEPEPD 

TCGGGCTCAATCAATACCTGGTTGGGTCACAGCTCCCATGCGAGCCCGAACCGGAC 
I I I I I I I I I I I I I I I I i 1 I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I 
TCGGGCTCAATCAATACCTGGTTGGGTCACAGCTCCCATGCGAGCCCGAACCGGAC 
VGLNQYLVGSQLPC EPEPD 



CDS:polyprotein [Hep 2169 

Query 6847 

Sbjct 5891 

CDS : non-structural p 1360 



AVLTSMLTDPSHITAETAK 
CAGTGCTCACTTCCATGCTCACCGACCCCTCCCACATTACGGCGGAGACGGCTAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGTGCTCACTTCCATGCTCACCGACCCCTCCCACATTACGGCGGAGACGGCTAAG 
AVLTSMLTDPSHITAETAK 



CDS :polyprotein [Hep 2189 

Query 6907 

Sbjct 5951 

CDS : non-structural p 1380 



RLARGSPPSLASSSASQLS 
GGCTGGCCAGGGGATCTCCCCCCTCCTTGGCCAGCTCATCAGCTAGCCAGCTGTCT 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCTGGCCAGGGGATCTCCCCCCTCCTTGGCCAGCTCATCAGCTAGCCAGCTGTCT 
RLARGSPPSLASSSASQ LS 



CDS:polyprotein [Hep 2209 PSLKATCTTRHDSPDADLI 

6967 CTTCCTTGAAGGCAACATGCACTACCCGTCATGACTCCCCGGACGCTGACCTCATC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

6011 CTTCCTTGAAGGCAACATGCACTACCCGTCATGACTCCCCGGACGCTGACCTCATC 
1400 PSLKATCTTRH DSPDADLI 



Query 

Sbjct 

CDS:non-structurai p 



CDS :polyprotein [Hep 2229 
Query 7027 

Sbjct 6071 



ANLLWRQEMGGNITRVESE 
CCAACCTCCTGTGGCGGCAGGAGATGGGCGGGAACATCACCCGCGTGGAGTCAG7UV 
I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCAACCTCCTGTGGCGGCAGGAGATGGGCGGGAACATCACCCGCGTGGAGTCAGAA 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?! 



10/18/07 



CDS: non-structural p 1420 A N L L W R Q 



M G G N 



R V 



CDS rpolyprotein [Hep 2249 

Query 7087 

Sbjct 6131 

CDS : non-structural p 1440 



KVVILDSFEPLQAEEDERE 
AGGTAGTAATTTTGGACTCTTTCGAGCCGCTCCAAGCGGAGGAGGATGAGAGGGAA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
AGGTAGTAATTTTGGACTCTTTCGAGCCGCTCCAAGCGGAGGAGGATGAGAGGGAA 
KVVI LDS FE PLQAE EDE-RE 



CDS rpolyprotein [Hep 22 69 

Query • 7147 

Sbjct 6191 

CDS: non-structural p 1460 



SVPAEILRRSRKFPRAMPI 
CCGTTCCGGCGGAGATCCTGCGGAGGTCCAGGAAATTCCCTCGAGCGATGCCCATA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGTTCCGGCGGAGATCCTGCGGAGGTCCAGGAAATTCCCTCGAGCGATGCCCATA 
SVPAEILRRSRKFPRAMPI 



CDS:polyprotein [Hep 2289 

Query 7207 

Sbjct 6251 

CDS : non-structural p 1480 



ARPDYNPP LLESWKDPDYV 
CACGCCCGGATTACAACCCTCCACTGTTAGAGTCCTGGAAGGACCCGGACTACGTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I 
CACGCCCGGATTACAACCCTCCACTGTTAGAGTCCTGGAAGGACCCGGACTACGTC 
ARPDYNPPLLESWKDPDYV 



CDS:polyprotein [Hep 2309 

Query 7267 

Sbjct 6311 

CDS : non-structural p 1500 



PVVHGCPLPPAKAPPIPPP 
CAGTGGTACACGGGTGTCCATTGCCGCCTGCCAAGGCCCCTCCGATACCACCTCCA 

I I I M I I I I I I I I M J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

CAGTGGTACACGGGTGTCCATTGCCGCCTGCCAAGGCCCCTCCGATACCACCTCCA 
PVVHGCPLPPAKAPPI PPP 



CDS rpolyprotein [Hep 2329 

Query 7327 

Sbjct 6371 

CDS: non-structural p 1520 



RKRTVVLSESTVSSALAEL 
GGAAGAGGACGGTTGTCCTGTCAGAATCTACCGTGTCTTCTGCCTTGGCGGAGCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGAAGAGGACGGTTGTCCTGTCAGAATCTACCGTGTCTTCTGCCTTGGCGGAGCTC 
RKRTVVLSESTVSSA LAEL 



CDS rpolyprotein [Hep 2349 

Query 7387 

Sbjct 6431 

CDS : non-structural p 1540 



TKTFGSSESSAVDSGTATA 

CAAAGACCTTCGGCAGCTCCGAATCGTCGGCCGTCGACAGCGGCACGGCAACGGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 i I I I I I I I M I I I i I I 
CAAAGACCTTCGGCAGCTCCGAATCGTCGGCCGTCGACAGCGGCACGGCAACGGCC 
TKTFGSSESSAVDSGTATA 



CDS rpolyprotein [Hep 2369 

Query 7447 

Sbjct 6491 

CDS rnon-structural p 1560 



PDQPSDDGDAGSDVESYSS 
CTGACCAGCCCTCCGACGACGGCGACGCGGGATCCGACGTTGAGTCGTACTCCTCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I M I I I I I I I I I I I I I I I I 
CTGACCAGCCCTCCGACGACGGCGACGCGGGATCCGACGTTGAGTCGTACTCCTCC 
PDQPSD DGDAGSDVESYSS 



CDS rpolyprotein [Hep 2389 

Query 7507 

Sbjct 6551 

CDS rnon-structural p 1580 



PPLEGEPGDPDLSDGSWST 
CCCCCCTTGAGGGGGAGCCGGGGGATCCCGATCTCAGCGACGGGTCTTGGTCTACC 

I I I I I II I II I II I I I I I II II II I I I M I I I I I II I II II II I I I I I I I I I I I II 

CCCCCCTTGAGGGGGAGCCGGGGGATCCCGATCTCAGCGACGGGTCTTGGTCTACC 
PPLEGEPGDPDLSDGSWST 



CDS rpolyprotein [Hep 2409 

Query 7567 

Sbjct 6611 

CDS : non-structural p 1600 S E E A S 



SEEASEDVVCCSMSYTWTG 
GCGAGGAGGCTAGTGAGGACGTCGTCTGCTGCTCGATGTCCTACACATGGACAGGC 

II I II II I II I I I I I I I I I II I I II II I I I II II II II II I I I I I M I 11 II II I I 

GCGAGGAGGCTAGTGAGGACGTCGTCTGCTGCTCGATGTCCTACACATGGACAGGC 



M S 



W 



CDS rpolyprotein [Hep 2429 
Query 7627 

Sbjct 6671 



LITPCAAEETKLPINALSN 

TGATCACGCCATGCGCTGCGGAGGAAACCAAGCTGCCCATCAATGCACTGAGCAAC 

I II I I I I I I I I I I I II I I II I I I I I I I I I II I I II I II I I II I I I I I I I I I I I I II 
TGATCACGCCATGCGCTGCGGAGGA7\ACCAAGCTGCCCATCAATGCACTGAGCAAC 



http://www,ncbi.nlm.nih.gov/BLAST^12seq/wblast2xgi?l 



10/18/07 



CDS: non-structural p 1620 L I 



C A A E 



K 



N 



N 



CDS :polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non-structural 



2449 LLRHHNLVYA^TTSRSASLR 
7687 TGCTCCGTCACCACAACTTGGTCTATGCTACAACATCTCGCAGCGCAAGCCTGCGG 
I I I I I I I I I I I f i I I I I I I I I I I i I I I t I I I I I I I I i 1 I I I M I I I I I I I I I I I I I 
6731 TGCTCCGTCACCACAACTTGGTCTATGCTACAACATCTCGCAGCGCAAGCCTGCGG 
1640 LLRHHNLVYATTSRSASLR 

2469 KKVTFDRLQVLDDHYRDVL 
7747 AGAAGGTCACCTTTGACAGACTGCAGGTCCTGGACGACCACTACCGGGACGTGCTC 
I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
6791 AGAAGGTCACCTTTGACAGACTGCAGGTCCTGGACGACCACTACCGGGACGTGCTC 
1660 KKVTFD RLQVLDDHYRDVL 



CDS: polyprotein [Hep 2489 

Query 7807 

Sbjct 6851 

CDS: non-structural p 1680 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non-structural 



2509 
7867 

6911 
1700 



EMKAKASTVKAKLLSVEEA 
AGATGAAGGCGAAGGCGTCCACAGTTAAGGCTAAACTTCTATCCGTGGAGGAAGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGATGAAGGCGAAGGCGTCCACAGTTAAGGCTA7\ACTTCTATCCGTGGAGGAAGCC 
EMKAKASTVKAKLLSVEEA 

KLTPPHSARSKFGYGAKDV 
AGCTGACGCCCCCACATTCGGCCAGATCTAT^TTTGGCTATGGGGCAAAGGACGTC 

I I I M I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I 

AGCTGACGCCCCCACATTCGGCCAGATCTAAATTTGGCTATGGGGCAAAGGACGTC 
KLTPPHSARSKFGYGAKDV 



CDS : polyprotein [Hep 2529 

Query 7927 

Sbjct 6971 

CDS: non-structural p 1720 



NLSSKAVNHIRSVWKDL LE 
ACCTATCCAGCAAGGCCGTTAACCACATCCGCTCCGTGTGGAAGGACTTGCTGGAA 
I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I 
ACCTATCCAGCAAGGCCGTTAACCACATCCGCTCCGTGTGGAAGGACTTGCTGGAA 
NLS SKAVNHIRSVWKDL LE 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



2549 TETPIDTTIMAKNEVFCVQ 
7987 CTGAGACACCAATTGACACCACCATCATGGCAA7\AAATGAGGTTTTCTGCGTCCAA 
I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7031 CTGAGACACCAATTGACACCACCATCATGGCAAAAAATGAGGTTTTCTGCGTCCAA 
1740 TETPIDTTIMAKN EVFCVQ 

2569 EKGGRKPARLIVFPDLGVR 
8047 AGAAGGGGGGCCGCAAGCCAGCTCGCCTTATCGTATTCCCAGATTTGGGGGTTCGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7 091 AGAAGGGGGGCCGCAAGCCAGCTCGCCTTATCGTATTCCCAGATTTGGGGGTTCGT 
1760 EKGGRKPARLIVFPDLGVR 



CDS: polyprotein [Hep 2589 

Query / 8107 

Sbjct 7151 

CDS: non-structural p 1780 

CDS: polyprotein [Hep 2609 

Query 8167 

Sbjct 7211 

CDS: non-structural p 1800 



CEKMALYDVVSTLPQAVMG 
GCGAGAA7\ATGGCCCTTTACGATGTGGTCTCCACCCTCCCTCAGGCCGTGATGGGC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 ri I I I I I I I I I I I I I I I I I I I I I I I I 

GCGAGAAAATGGCCCTTTACGATGTGGTCTCCACCCTCCCTCAGGCCGTGATGGGC 
CEKMALYDVVSTLPQAVMG 

SYGFQYSPGQRVEFLVNAW 
CATACGGATTCCAATACTCTCCTGGACAGCGGGTCGAGTTCCTGGTGAATGCCTGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I 

CATACGGATTCCAATACTCTCCTGGACAGCGGGTCGAGTTCCTGGTGAATGCCTGG 
SYGFQYSPGQRVEFLVNAW 



CDS : polyprotein 
Query 

Sbjct 



[Hep 2629 AK KCPMGFAYDTRCFDSTV 
8227 CGAAGAAATGCCCTATGGGCTTCGCATATGACACCCGCTGTTTTGACTCAACGGTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7271 CGAAGAAATGCCCTATGGGCTTCGCATATGACACCCGCTGTTTTGACTCAACGGTC 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 1820 A K K C 



M 



D 



CDS:polyprotein [Hep 2649 

Query 8287 

Sbjct 7331 

CDS : non-structural p 1840 



ENDIRVEES lYQCCDLAPE 
AGAATGACATCCGTGTTGAGGAGTCAATCTACCAATGTTGTGACTTGGCCCCCGAA 
1 I I I i I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
AGAATGACATCCGTGTTGAGGAGTCAATCTACCAATGTTGTGACTTGGCCCCCGAA 
END IR.VEES lYQC CDLAPE 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non-structural 



2669 RQAIRSLTERLYIGGPLTN 
8347 GACAGGCCATAAGGTCGCTCACAGAGCGGCTTTACATCGGGGGCCCCCTGACTAAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I 

7391 GACAGGCCATAAGGTCGCTCACAGAGCGGCTTTACATCGGGGGCCCCCTGACTAAT 
1860 RQAIRSLTERLYIGGPLTN 



CDS: polyprotein [Hep 2689 

Query 8407 

Sbjct 7451 

CDS: non-structural p 1880 



KGQNCGYRRCRASGVLTTS 
AAGGGCAGAACTGCGGCTATCGCCGGTGCCGCGCGAGCGGTGTACTGACGACCAGC 
I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGGGCAGAACTGCGGCTATCGCCGGTGCCGCGCGAGCGGTGTACTGACGACCAGC 
KGQNCGYRRCRASGVLTTS 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



2709 GNTLTCYLKAAAACRAAKL 
8467 GTAATACCCTCACATGTTACTTGAAGGCCGCTGCGGCCTGTCGAGCTGCGAAGCTC 

M M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

7511 GTAATACCCTCACATGTTACTTGAAGGCCGCTGCGGCCTGTCGAGCTGCGAAGCTC 
1900 GNTLTCYLKAAAACRAAKL 



CDS: polyprotein [Hep 2729 

Query 8527 

Sbjct 7571 

CDS: non-structural p 1920 



DCT MLVCGDDLVVI CESAG 
ACTGCACGATGCTCGTATGCGGAGACGACCTTGTCGTTATCTGTGAAAGCGCGGGG 
I I I i I Ml I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACTGCACGATGCTCGTATGCGGAGACGACCTTGTCGTTATCTGTGAAAGCGCGGGG 
DCT MLVCGDDLVVICESAG 



CDS: polyprotein [Hep 2749 

Query 8587 

Sbjct 7631 

CDS: non-structural p 1940 



QEDEASLRAFTEAMTRYSA 

AAGAGGACGAGGCGAGCCTACGGGCCTTCACGGAGGCTATGACTAGATACTCTGCC 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I M I I I I I I I I I 

AAGAGGACGAGGCGAGCCTACGGGCCTTCACGGAGGCTATGACTAGATACTCTGCC 
QEDEASLRAFTEAMTRYSA 



CDS: polyprotein [Hep 2769 

Query 8647 

Sbjct 7691 

CDS : non-structural p 1960 



PGDPPKPEYDLELITSCSS 
CTGGGGACCCGCCCAAACCAGAATACGACTTGGAGTTGATAACATCATGCTCCTCC 
i II I I I II I II I I II I I I II I I I I I I I I I I I II I I I I I I II II I I II I I I II II II 
CTGGGGACCCGCCCAAACCAGAATACGACTTGGAGTTGATAACATCATGCTCCTCC 
PGDPPKPEYDLELITSCSS 



CDS: polyprotein [Hep 2789 

Query 8707 

Sbjct 7751 

CDS: non-structural p 1980 



VSVAHDASGKRVYYLTRDP 
TGTCAGTCGCGCACGATGCATCTGGCAAAAGGGTGTACTATCTCACCCGTGACCCC 

I I M I I II I I I I II I I I I I II II I I I II I I I I II II II I I I I I II I I I I I I I I I I I 

TGTCAGTCGCGCACGATGCATCTGGCAAAAGGGTGTACTATCTCACCCGTGACCCC 
VSVAHDASGKRVYYLTRDP 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



2809 TPLARAAWETARHTPVNSW 
8767 CCCCCCTTGCGCGGGCTGCGTGGGAGACAGCTAGACACACTCCAGTCAATTCCTGG 

II M I I II I M III M I I I II I I I I II I I I I I I I I I I II I I I I I I I II I I M I I I I 

7 811 CCCCCCTTGCGCGGGCTGCGTGGGAGACAGCTAGACACACTCCAGTCAATTCCTGG 
2000 TPLARAAWETARHT PVNSW 



CDS: polyprotein [Hep 2829 
Query 8827 

Sbjct 7871 



GNI IMYA PTLWARMI LMTH 
GCAACATCATCATGTATGCGCCCACCTTGTGGGCAAGGATGATCCTGATGACTCAT 
I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCAACATCATCATGTATGCGCCCACCTTGTGGGCAAGGATGATCCTGATGACTCAT 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2xgi?l 



10/18/07 



CDS: non-structural p 2020 



N 



M 



W 



M 



M 



H 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS .-polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 



Sbjct 
CDS : non- 



structural p 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



2849 F SILLAQEQLEKALDCQIY 
8887 TCTCCATCCTTCTAGCTCAGG7\ACAACTTGAAAAAGCCCTAGATTGTCAGATCTAC 
I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7 931 TCTCCATCCTTCTAGCTCAGGAACAACTTGA7\7\AAGCCCTAGATTGTCAGATCTAC 
2040 FSILLAQEQLEKALDCQIY 

2869 ACYSIEPLDLPQIIQRLHG 
8947 CCTGTTACTCCATTGAGCCACTTGACCTACCTCAGATCATTCAACGACTCCATGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7991 CCTGTTACTCCATTGAGCCACTTGACCTACCTCAGATCATTCAACGACTCCATGGC 
2060 ACYSIEPLDLPQII QRLHG 

2889 SAFSLHSYSPGEINRVASC 
9007 GCGCATTTTCACTCCATAGTTACTCTCCAGGTGAGATCAATAGGGTGGCTTCATGC 

1 1 1 1 1 1 1 M i I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n I I I I I I I I I I I I I I I I I I 

8051 GCGCATTTTCACTCCATAGTTACTCTCCAGGTGAGATCAATAGGGTGGCTTCATGC 
2080 SAFSLHSYSPGEINRVASC 

2909 RKLGVPPLRVWRHRARSVR 
9067, GGAAACTTGGGGTACCGCCCTTGCGAGTCTGGAGACATCGGGCCAGAAGTGTCCGC 

I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

8111 GGAAACTTGGGGTACCGCCCTTGCGAGTCTGGAGACATCGGGCCAGAAGTGTCCGC 
2100 RKLGVPPL RVWRHRARSVR 

2929 RLLSQGGRAATCGKYLFNW 
9127 GGCTACTGTCCCAGGGGGGGAGGGCTGCCACTTGTGGCAAGTACCTCTTCAACTGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
8171 GGCTACTGTCCCAGGGGGGGAGGGCTGCCACTTGTGGCAAGTACCTCTTCAACTGG 
2120 RLLSQGGRAATCGKYLFNW 



CDS: polyprotein [Hep 2949 

Query 9187 

Sbjct 8231 

CDS: non-structural p 2140 

CDS: polyprotein [Hep 2969 

Query 9247 

Sbjct 8291 

CDS: non-structural p 2160 



VRTKLKLTPI PAASQLDLS 
TAAGGACCAAGCTCAAACTCACTCCAATCCCGGCTGCGTCCCAGTTGGATTTATCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I 
TAAGGACCAAGCTCAAACTCACTCCAATCCCGGCTGCGTCCCAGTTGGATTTATCC 
VRTKLKLT PI PAASQLDLS 

WFVAGYSGGDIYHSLS RAR 
GGTTCGTTGCTGGTTACAGCGGGGGAGACATATATCACAGCCTGTCTCGTGCCCGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTTCGTTGCTGGTTACAGCGGGGGAGACATATATCACAGCCTGTCTCGTGCCCGA 
WFVAGYSGGDIYHSLSRAR 



CDS: polyprotein [Hep 2989 

Query 9307 

Sbjct 8351 

CDS: non-structural p 2180 



RWFMWCLLLLSVGVGIYLL 
GCTGGTTCATGTGGTGCCTACTCCTACTTTCTGTAGGGGTAGGCATCTATCTACTC 
I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
GCTGGTTCATGTGGTGCCTACTCCTACTTTCTGTAGGGGTAGGCATCTATCTACTC 
RWFMWCLLL LSVGVGIYLL 



CDS: polyprotein [Hep 3009 

Query 9367 

Sbjct 8411 

CDS: non-structural p 2200 



N R 

ACCGATGAACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTG 9412 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

ACCGATGAACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTG 8456 
N R 



http://www.ncbi.nIm.nih.gov/BLAST/bl2seq/wblast2.cgi?! 



10/18/07 



Score = 719 bits (374), Expect =0.0 
Identities = 388/388 (100%), Gaps = 0/388 (0%) 
Strand=Plus/Plus 

Query 2 CCAGCCCCCGATTGGGGGCGACACTCCACCATAGATCACTCCCCTGTGAGGAACTAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 2 CCAGCCCCCGATTGGGGGCGACACTCCACCATAGATCACTCCCCTGTGAGGAACTAC 



Query 62 CTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 62 CTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGG 

Query 122 CCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 122 CCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCC 



Query 182 ACGACCGGGTCCTTTCTTGGATC7\ACCCGCTCAATGCCTGGAGATTTGGGCGTGCCC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 182 ACGACCGGGTCCTTTCTTGGATCAACCCGCTC7\ATGCCTGGAGATTTGGGCGTGCCC 



Query 242 CGAGACTGCTAGCCGAGTAGTGTTGGGTCGCGA7VAGGCCTTGTGGTACTGCCTGATA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sb j ct 242 CGAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATA 



CDS :polyprotein [Hep 1 

Query 302 

Sbjct 302 

CDS:core-neo fusion 1 



M S T N P K 

TGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACCATGAGCACGAATCCTAA 
I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACCATGAGCACGAATCCTAA 

M S T N P K 



CDS:polyprotein [Hep 8 

Query 362 

Sbjct 362 

CDS:core-neo fusion 8 



QRKTKRNTN 
TCAAAGA7W\ACCA7\ACGTAACACCAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCAAAGAAAAACCJ\AACGTAACACCAAC 

QRKTKRNTN 



J 
J 



Score = 189 bits (98), Expect = 2e-43 
Identities = 98/98 (100%), Gaps = 0/98 (0%) 
Strand=Plus/Plus 

Query 9508 GGTGGCTCCATCTTAGCCCTAGTCACGGCTAGCTGTGAAAGGTCCGTGAGCCGCTTGACT 9567 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Sb j ct 8552 GGTGGCTCCATCTTAGCCCTAGTCACGGCTAGCTGTGAAAGGTCCGTGAGCCGCTTGACT 8611 



Query 9568 GCAGAGAGTGCTGATACTGGCCTCTCTGCAGATCAAGT 9605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Sbjct 8612 GCAGAGAGTGCTGATACTGGCCTCTCTGCAGATCAAGT 8649 



CPU time: 0.16 user sees. 0.04 sys. sees 0.20 total sees. 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2xgi?l 



10/18/07 



http://www.ncbi.nlm.nih.gov/BLASmi2seq/wblast2.cgi? 1 1 0/1 8/07 




PubMed 



Blast 2 Sequences results 

Entrez BLAST OMIM Taxonomy Structure 



BLAST 2 SEQUENCES RESULTS VERSION BLASTN 2.2.17 [Aug-26-2007] 



Match:|l^ ] Mismatch:|;::2 J gap open:)5 J gap extension: ^ 



x_dropofr: |0 i expect:|lO:OOo5 wordsize: IH \ Filter E View option [ Standard 



Masking character option |X for protei n , n for nucleotide M Masking color option | Black j 
E Show CDS translation 



Sequence 1: gi|5420376 | Hepatitis C virus type lb complete genome, isolate Conl 
Length = 9604 (1 ..9605) 

Sequence 2: gi | 5441834 | Hepatitis C virus replicon I377/NS3-3'UTR 
Length = 7988 (1 7989) 



a. 




NOTE:Bitscore and expect value are calculated based on the size of the nr database. 

NOTE:If protein translation is reversed, please repeat the search with reverse strand of the query 
sequence. 



Score = 1.142e+04 bits (5937), Expect =0.0 
Identities = 5993/5993 (100%), Gaps = 0/5993 (0%) 
Strand=Plus/Plus 



CDS ipolyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



CDS : polyprotein 
Query 

Sbjct 



[Hep 



1027 APITAYSQQ TRGLLG CI I T 
3420 GCGCCTATTACGGCCTACTCCCAACAGACGCGAGGCCTACTTGGCTGCATCATCAC 
I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1804 GCGCCTATTACGGCCTACTCCCAACAGACGCGAGGCCTACTTGGCTGCATCATCAC 
2 APITAYSQQTRGLLGCIIT 

1047 LTGRDRNQVEGEVQVVSTA 
3480 CTCACAGGCCGGGACAGGAACCAGGTCGAGGGGGAGGTCCAAGTGGTCTCCACCGC 
I I I I I I I I I I I I I I I I I I I I I I I I i I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
1864 CTCACAGGCCGGGACAGGAACCAGGTCGAGGGGGAGGTCCAAGTGGTCTCCACCGC 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS : non-structural p 22 



L T G R 



N 



Q V 



T A 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non-structural 



1067 QSF. LATCVNGVCWTVYHGA 
3540 CAATCTTTCCTGGCGACCTGCGTCAATGGCGTGTGTTGGACTGTCTATCATGGTGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
1924 CAATCTTTCCTGGCGACCTGCGTCAATGGCGTGTGTTGGACTGTCTATCATGGTGC 
42 QSFLATCVNGVCWTVYHGA 



CDS : polyprotein [Hep 
Query 



Sbjct 
CDS : non- 



structural p 



1087 SKTLAGPKGPITQMYTNVD 
3600 TCAAAGACCCTTGCCGGCCCAAAGGGCCCAATCACCCAAATGTACACCAATGTGGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1984 TCAAAGACCCTTGCCGGCCCAAAGGGCCCAATCACCCAAATGTACACCAATGTGGA 
62 SKTLAGPKGPITQMYTNVD 



CDS: polyprotein [Hep 1107 

Query 3660 

Sbjct 2044 

CDS: non-structural p 82 



DLVGWQAPPGARSLTPCTC 
GACCTCGTCGGCTGGCAAGCGCCCCCCGGGGCGCGTTCCTTGACACCATGCACCTG 
I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACCTCGTCGGCTGGCAAGCGCCCCCCGGGGCGCGTTCCTTGACACCATGCACCTG 

DLVGWQAPPGARSLTPCTC 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non- structural 



1127 SSD LYLV.TRHADVIPVRRR 
3720 AGCTCGGACCTTTACTTGGTCACGAGGCATGCCGATGTCATTCCGGTGCGCCGGCG 

I I I I I I I I M I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 1 

2104 AGCTCGGACCTTTACTTGGTCACGAGGCATGCCGATGTCATTCCGGTGCGCCGGCG 
102 SSDLYLVTRHADVI PVRRR 



CDS: polyprotein [Hep 1147 

Query 3780 

Sbjct 2164 

CDS: non-structural p 122 



DSRGSLLSPRPVSYLKGSS 
GACAGCAGGGGGAGCCTACTCTCCCCCAGGCCCGTCTCCTACTTGAAGGGCTCTTCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
' GACAGCAGGGGGAGCCTACTCTCCCCCAGGCCCGTCTCCTACTTGAAGGGCTCTTC 
D SRGSLLSPRPVSYLKGSS 



CDS: polyprotein [Hep 1167 

Query 3840 

Sbjct 2224 

CDS : non-structural p 142 



GPLLCPSGHAVGI FRAAV.C 
GGTCCACTGCTCTGCCCCTCGGGGCACGCTGTGGGCATCTTTCGGGCTGCCGTGTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGTCCACTGCTCTGCCCCTCGGGGCACGCTGTGGGCATCTTTCGGGCTGCCGTGTG 

GPLLCPSGHAVGI FRAAVC 



CDS: polyprotein [Hep 1187 

Query 3900 

Sbjct 2284 

CDS : non-structural p 162 



RGVAKAVDFVPVE SMETTM 
CGAGGGGTTGCGAAGGCGGTGGACTTTGTACCCGTCGAGTCTATGGAAACCACTAT 
I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGAGGGGTTGCGAAGGCGGTGGACTTTGTACCCGTCGAGTCTATGGAAACCACTAT 

RGVAKAVDFVPVESMETTM 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



1207 SPVFTDNSSPPAVPQTFQV 
3960 TCCCCGGTCTTCACGGACAACTCGTCCCCTCCGGCCGTACCGCAGACATTCCAGGT 

I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2344 TCCCCGGTCTTCACGGACAACTCGTCCCCTCCGGCCGTACCGCAGACATTCCAGGT 
182 SPVFTDNSSPPAVPQTFQV 



CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



1227 HLHAPTGSGKSTKVPAAYA 
4020 CATCTACACGCCCCTACTGGTAGCGGCAAGAGCACTAAGGTGCCGGCTGCGTATGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2404 CATCTACACGCCCCTACTGGTAGCGGCAAGAGCACTAAGGTGCCGGCTGCGTATGC 
202 HLHAPTGSGKSTKVPAAYA 



CDS : polyprotein 
Query 

Sbjct 



[Hep 1247 QGYKVLVLNPSVAATLGFG 
4080 CAAGGGTATAAGGTGCTTGTCCTGAACCCGTCCGTCGCCGCCACCCTAGGTTTCGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
2464 CAAGGGTATAAGGTGCTTGTCCTGAACCCGTCCGTCGCCGCCACCCTAGGTTTCGG 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 222 



K V . 



N 



A T 



CDSipolyprotein [Hep 1267 

Query 4140 

Sbjct 2524 

CDS: non-structural p 242 Y M 



YMSKAHGIDPNIRTGVRT I 
TAT AT GT CT AAGGC AC AT GGT AT C GAC C CT AAC AT C AGAAC C GGGGT AAGGAC CAT 
I I I I I I I II I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TATATGTCTAAGGCACATGGTATCGACCCTAACATCAGAACCGGGGTAAGGACCAT 



K A H 



P N 



G V R 



CDS:polyprotein [Hep 1287 

Query 4200 

Sbjct 2584 

CDS: non-structural p 262 



TGAPITYSTYGKFLADGGC 
ACGGGTGCCCCCATCACGTACTCCACCTATGGCAAGTTTCTTGCCGACGGTGGTTG 
II II II II II I I II II II II II II II II II I II II II II II II I II II II II II II 
ACGGGTGCCCCCATCACGTACTCCACCTATGGCAAGTTTCTTGCCGACGGTGGTTG 

TGAPITYSTYGKFLADGGC 



CDSipolyprotein [Hep 1307 

Query . 4260 

Sbjct 2644 

CDS : non-structural p 282 



GGAYDIIICDECHSTDSTT 
GGGGGCGCCTATGACATCATAATATGTGATGAGTGCCACTCAACTGACTCGACCAC 
I I II f I I I I I I I I I I I I II II I II I I I I I I I II I I II II I II I I II II I I I I II I I 

GGGGGCGCCTATGACATCATAATATGTGATGAGTGCCACTCAACTGACTCGACCAC 
GGAYDI I I CDECHS.TDSTT 



CDS:polyprotein [Hep 1327 

Query 4320 

Sbjct 2704 

CDS: non-structural p 302 



LGIGTVLDQAETAGARLVV 
CTGGGCATCGGCACAGTCCTGGACCAAGCGGAGACGGCTGGAGCGCGACTCGTCGT ' 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

CTGGGCATCGGCACAGTCCTGGACCAAGCGGAGACGGCTGGAGCGCGACTCGTCGT 
LGIGTVLDQAETAGARLVV 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS : non-structural p 



1347 ATATPPGSVTVPHPNIEEV 
4380 GCCACCGCTACGCCTCCGGGATCGGTCACCGTGCCACATCCAAACATCGAGGAGGT 
I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I II U I I I II I II 
2764 GCCACCGCTACGCCTCCGGGATCGGTCACCGTGCCACATCCAAACATCGAGGAGGT 
322 ATATPPGS VTVPHPNIEEV 

1367 LSSTGEIPFYGKAIPIETI 
4440 CTGTCCAGCACTGGAGAAATCCCCTTTTATGGCAAAGCCATCCCCATCGAGACCAT 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2824 CTGTCCAGCACTGGAGAAATCCCCTTTTATGGCA7\AGCCATCCCCATCGAGACCAT 
342 LSSTGEIPFYGKAIPIETI 

1387 GGRHLIFCHSKKKCDELAA 
4500 GGGGGGAGGCACCTCATTTTCTGCCATTCCAAGAAGATU^TGTGATGAGCTCGCCGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2884 GGGGGGAGGCACCTCATTTTCTGCCATTCCAAGAAG7\AATGTGATGAGCTCGCCGC 
362 GGRHLI FCHSKKKCDELAA 

1407 LSGLGLNAVAYYRGLDVSV 
4560 CTGTCCGGCCTCGGACTCAATGCTGTAGCATATTACCGGGGCCTTGATGTATCCGT 

II I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2944 CTGTCCGGCCTCGGACTCAATGCTGTAGCATATTACCGGGGCCTTGATGTATCCGT 
382 LSGLGLNAVAYYRGLDVSV 



CDS: polyprotein [Hep 1427 

Query 4620 

Sbjct 3004 

CDS: non-structural p 402 



PTSGDVIVVATDALMTGFT 
CCAACTAGCGGAGACGTCATTGTCGTAGCAACGGACGCTCTAATGACGGGCTTTAC 

II II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II II I I I I I I I I I I I I I 

CCAACTAGCGGAGACGTCATTGTCGTAGCAACGGACGCTCTAATGACGGGCTTTAC 
PTSGDVIVVATDALMTGFT 



CDS : polyprotein 
Query 

Sbjct 



[Hep 1447 DFDSVIDCNTCVTQTVDFS 
4680 GATTTCGACTCAGTGATCGACTGCAATACATGTGTCACCCAGACAGTCGACTTCAG- 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
3064 GATTTCGACTCAGTGATCGACTGCAATACATGTGTCACCCAGACAGTCGACTTCAG 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 422 



V 



N 



V 



D 



CDS : polyprotein 
Query 



[Hep 



Sbjct 

CDS: non-structural p 

CDS : polyprotein [Hep 
Query 

Sbjct 

CDS: non-structural p 



1467 
4740 

3124 
442 

1487 
4800 

3184 
462 



CDS : polyprotein [Hep 1507 

Query 4860 

Sbjct 3244 

CDS: non-structural p 482 

CDS: polyprotein [Hep 1527 

Query 4920 

Sbjct 3304 

CDS : non-structural p 502 

CDS : polyprotein [Hep 1547 

Query 4980 

Sbjct 3364 

CDS: non-structural p 522 

CDS: polyprotein [Hep 1567 

Query 5040 

Sbjct 3424 

CDS : non-structural p 542 

CDS: polyprotein [Hep 1587 

Query 5100 

Sbjct 3484 

CDS : non-structural p 562 

CDS : polyprotein [Hep 1607 

Query 5160 

Sbjct 3544 

CDS: non-structural p 582 

CDS: polyprotein [Hep 1627 

Query 5220 

Sbjct 3604 

CDS : non-structural p 602 

CDS: polyprotein [Hep 1647 

Query 5280 

Sbjct 3664 



DPTFTIETTTVPQDAVSRS 
GACCCGACCTTCACCATTGAGACGACGACCGTGCCACAAGACGCGGTGTCACGCTC 
I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I n I I I I I I 11 I I I I I I I I I I I 
GACCCGACCTTCACCATTGAGACGACGACCGTGCCACAAGACGCGGTGTCACGCTC 

DPTFTIETTTVPQDAVSRS 

RRGRTGRGRMGIYRFVTPG 
CGGCGAGGCAGGACTGGTAGGGGCAGGATGGGCATTTACAGGTTTGTGACTCCAGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGGCGAGGCAGGACTGGTAGGGGCAGGATGGGCATTTACAGGTTTGTGACTCCAGG 
RRGRTGRGRMGIYRFVTPG 

RPSGMFDSSVLCECYDAGC 
CGGCCCTCGGGCATGTTCGATTCCTCGGTTCTGTGCGAGTGCTATGACGCGGGCTG 
I I I I I I I I M I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGGCCCTCGGGCATGTTCGATTCCTCGGTTCTGTGCGAGTGCTATGACGCGGGCTG 

RPSGMFDSSVLCECYDAGC 

WYELTPAETSVRLRAYLNT 
TGGTACGAGCTCACGCCCGCCGAGACCTCAGTTAGGTTGCGGGCTTACCTAAACAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGTACGAGCTCACGCCCGCCGAGACCTCAGTTAGGTTGCGGGCTTACCTAAACAC 
WYELTPAETSVRLRAYLNT 

GLPVCQDHLEFWESVFTGL 
GGGTTGCCCGTCTGCCAGGACCATCTGGAGTTCTGGGAGAGCGTCTTTACAGGCCT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGTTGCCCGTCTGCCAGGACCATCTGGAGTTCTGGGAGAGCGTCTTTACAGGCCT 

GLPVCQDHLEFWESVFTGL 

HIDAHFLSQTKQAGDNFPY 
CACATAGACGCCCATTTCTTGTCCCAGACTAAGCAGGCAGGAGACAACTTCCCCTA 
I I M I I I I I I I I I i I I I I I I I I I I I I I i I I I I I I I I I I I I I M M I I I I I I I I I I I 
CACATAGACGCCCATTTCTTGTCCCAGACTAAGCAGGCAGGAGACAACTTCCCCTA 

HIDAHFLSQTKQAGDNFPY 

VAYQATVCARAQAPPPSWD 
GTAGCATACCAGGCTACGGTGTGCGCCAGGGCTCAGGCTCCACCTCCATCGTGGGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTAGCATACCAGGCTACGGTGTGCGCCAGGGCTCAGGCTCCACCTCCATCGTGGGA 

VAYQATVCARAQAPPPSWD 

MW. KCLIRLKPTLHGPTPLL 
ATGTGGAAGTGTCTCATACGGCTA7\AGCCTACGCTGCACGGGCCAACGCCCCTGCT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I 

ATGTGGAAGTGTCTCATACGGCTAAAGCCTACGCTGCACGGGCCAACGCCCCTGCT 
MWKCLIRLKPTLHGPTPLL 

RLGAVQNEVTTTHPITKY I 
AGGCTGGGAGCCGTTCAAAACGAGGTTACTACCACACACCCCATAACCAAATACAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGGCTGGGAGCCGTTCAAAACGAGGTTACTACCACACACCCCATAACCAAATACAT 
RLGAVQNEVTTTHPITKYI 

ACMSADLEVVTSTWVLVGG 
GCATGCATGTCGGCTGACCTGGAGGTCGTCACGAGCACCTGGGTGCTGGTAGGCGG 
I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCATGCATGTCGGCTGACCTGGAGGTCGTCACGAGCACCTGGGTGCTGGTAGGCGG 



http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi?l 
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CDS: non-structural p 622 



ACM 



A D 



V V T 



T W V L V 



CDSrpolyprotein [Hep 1667 

Query 5340 

Sbjct 3724 

CDS : non-structural p 642 

CDS :polyprotein [Hep 1687 

Query 5400 

Sbjct 3784 

CDS: non-structural p 662 

CDS:polyprotein [Hep 1707 

Query 5460 

Sbjct 3844 

CDS: non-structural p 682 



CDS:polyprotein [Hep 1727 
Query 



Sbjct 

CDS: non-structural p 702 



CDS :polyprotein [Hep 1747 

Query 5580 

Sbjct 3964 

CDS: non-structural p 722 



LAALAAYCLTTGSVVIVGR 
CTAGCAGCTCTGGCCGCGTATTGCCTGACAACAGGCAGCGTGGTCATTGTGGGCAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTAGCAGCTCTGGCCGCGTATTGCCTGACAACAGGCAGCGTGGTCATTGTGGGCAG 

LAALAAYCLTTGSVVIVGR 

ILSGKPAIIPDREVLYREF 
ATCTTGTCCGGAAAGCCGGCCATCATTCCCGACAGGGAAGTCCTTTACCGGGAGTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCTTGTCCGGAAAGCCGGCCATCATTCCCGACAGGGAAGTCCTTTACCGGGAGTT 

ILSGKPAIIPDREVLYREF 

EMEECASHLPYIEQGMQLA 
GAGATGGAAGAGTGCGCCTCACACCTCCCTTACATCGAACAGGGAATGCAGCTCGC 
I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGATGGAAGAGTGCGCCTCACACCTCCCTTACATCGTVACAGGGAATGCAGCTCGC 

EMEECASHLPYIEQGMQLA 



QFKQKAIGLLQTATKQAEA 
5520 CAATTCAAACAGAAGGCAATCGGGTTGCTGCA7\ACAGCCACCAAGCAAGCGGAGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I 
3904 CAATTCAAACAGAAGGCAATCGGGTTGCTGCA7\ACAGCCACCAAGCAAGCGGAGGC 
QFKQKAIGLLQTATKQA EA 



APVVESKWRTLEAFWAKHM 
GCTCCCGTGGTGGAATCCAAGTGGCGGACCCTCGAAGCCTTCTGGGCGAAGCATAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCTCCCGTGGTGGAATCCAAGTGGCGGACCCTCGAAGCCTTCTGGGCGAAGCATAT 

APVVESKWRTLEAFWAKHM 



CDS:polyprotein [Hep 1767 

Query 5640 

Sbjct 4024 

CDS: non-structural p 742 

CDS:polyprotein [Hep 17 87 

Query 5700 

Sbjct 4084 

CDS: non-structural p 762 

CDS:polyprotein [Hep 1807 

Query 5760 

Sbjct 4144 

CDS: non-structural p 782 

CDS:polyprotein [Hep 1827 

Query 5820 

Sbjct 4204 

CDS: non-structural p 802 



NFISGIQYLAGLSTLPGNP 

AATTTCATCAGCGGGATACAATATTTAGCAGGCTTGTCCACTCTGCCTGGCAACCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AATTTCATCAGCGGGATACAATATTTAGCAGGCTTGTCCACTCTGCCTGGCAACCC 
NFISGIQYLAGLSTLPGNP 

IAS LMAFTAS ITS PL TTQH 
ATAGCATCACTGATGGCATTCACAGCCTCTATCACCAGCCCGCTCACCACCCAACA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATAGCATCACTGATGGCATTCACAGCCTCTATCACCAGCCCGCTCACCACCCAACA 

lASLMAFTASITSPLTTQH 

LLFNI LGGWVAAQLAPPSA 
CTCCTGTTTAACATCCTGGGGGGATGGGTGGCCGCCCAACTTGCTCCTCCCAGCGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I M I I I 

CTCCTGTTTAACATCCTGGGGGGATGGGTGGCCGCCCAACTTGCTCCTCCCAGCGC 
LLFNI LGGWVAAQLAPPSA 

SAFVGAGIAGAAVGSIGLG 
TCTGCTTTCGTAGGCGCCGGCATCGCTGGAGCGGCTGTTGGCAGCATAGGCCTTGG 

I I I I I M I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I M I M I I I I I I 

TCTGCTTTCGTAGGCGCCGGCATCGCTGGAGCGGCTGTTGGCAGCATAGGCCTTGG 
SAFVGAGIAGAAVGS IGLG 



CDS : polyprotein 
Query 

Sbjct 



[Hep 1847 VLVDILAGYGAGVAGALVA 
5880 GTGCTTGTGGATATTTTGGCAGGTTATGGAGCAGGGGTGGCAGGCGCGCTCGTGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4264 GTGCTTGTGGATATTTTGGCAGGTTATGGAGCAGGGGTGGCAGGCGCGCTCGTGGC 
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CDS: non-structural p 822 



V 



A G 



G A 



A G A 



CDS:polyprotein [Hep 1867 

Query 5940 

Sbjct 4324 

CDS: non-structural p 842 



KVMSGEMPSTEDLVN LL PA 
AAGGTCATGAGCGGCGAGATGCCCTCCACCGAGGACCTGGTTAACCTACTCCCTGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I 
AAGGTCATGAGCGGCGAGATGCCCTCCACCGAGGACCTGGTTAACCTACTCCCTGC 
KVMSGEMPSTEDL VNLLPA 



CDS :polyprotein [Hep 18 87 

Query 6000 

Sbjct ' 4384 

CDS : non-structural p 862 



LSPGALVVGVVCAAILRRH 
CTCTCCCCTGGCGCCCTAGTCGTCGGGGTCGTGTGCGCAGCGATACTGCGTCGGCA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTCTCCCCTGGCGCCCTAGTCGTCGGGGTCGTGTGCGCAGCGATACTGCGTCGGCA 
LSPGALVVGVVCAAI LRRH 



CDS :polyprotein [Hep 1907 

Query 6060 

Sbjct 4444 

CDS: non-structural p 882 



GPGEGAVQWMNRLIA FASR 
GGCCCAGGGGAGGGGGCTGTGCAGTGGATG7\ACCGGCTGATAGCGTTCGCTTCGCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCCCAGGGGAGGGGGCTGTGCAGTGGATGAACCGGCTGATAGCGTTCGCTTCGCG 

GPGEGAVQWMNRLIAFASR 



CDS:polyprotein [Hep 1927 
Query 



Sbjct 

CDS : non-structural p 902 



NHVSPTHYVPESDAAARVT 
612 0 AACCACGTCTCCCCCACGCACTATGTGCCTGAGAGCGACGCTGCAGCACGTGTCAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 
4504 AACCACGTCTCCCCCACGCACTATGTGCCTGAGAGCGACGCTGCAGCACGTGTCAC 
NHVS PTHYVPESDAAARVT 



CDS:polyprotein [Hep 1947 

Query 6180 

Sbjct 4564 

CDS: non-structural p 922 

CDS:polyprotein [Hep 1967 

Query 6240 

Sbjct 4624 

CDS: non-structural p 942 



ILSSLTITQLLKRLHQWIN 
ATCCTCTCTAGTCTTACCATCACTCAGCTGCTGAAGAGGCTTCACCAGTGGATCAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I .I I I I I I I I I I I I I I I I I I I I I I I I 
ATCCTCTCTAGTCTTACCATCACTCAGCTGCTGAAGAGGCTTCACCAGTGGATCAA 

ILSSLTITQLLKRLHQWIN 

DCSTPCSGSWLRDVWDWIC 
GACTGCTCCACGCCATGCTCCGGCTCGTGGCTAAGAGATGTTTGGGATTGGATATG 
I II II I I II II I II I I II I I II II II I II II I I I II II II M II I II II I II I II I 
GACTGCTCCACGCCATGCTCCGGCTCGTGGCTAAGAGATGTTTGGGATTGGATATG 
DCSTPCSGSWLRD VWDWIC 



CDS:polyprotein [Hep 1987 

Query 6300 

Sbjct 4684 

CDS: non-structural p 962 



VLTDFKTWLQSKLLPRLPG 
GTGTTGACTGATTTCAAGACCTGGCTCCAGTCCAAGCTCCTGCCGCGATTGCCGGG 
II II I II I II I I II II II I II I I I II II I II I I II II I I I I II I II I I I I II II II 
GTGTTGACTGATTTCAAGACCTGGCTCCAGTCCAAGCTCCTGCCGCGATTGCCGGG 

VLTDFKTWLQSKLLPRLPG 



CDS:polyprotein [Hep 2007 

Query 6360 

Sbjct 4744 

CDS: non-structural p 982 



PFFSCQRGYKGVWRGDGIM 
CCCTTCTTCTCATGTCAACGTGGGTACAAGGGAGTCTGGCGGGGCGACGGCATCAT 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II II I I M I I I I I I II II I 

CCCTTCTTCTCATGTCAACGTGGGTACAAGGGAGTCTGGCGGGGCGACGGCATCAT 
PFFSCQRGYKGVWRGDGIM 



CDS:polyprotein [Hep 2027 
Query 



Sbjct 

CDS: non-structural p 



TTCPCGAQITGHVKNG SMR 
6420 ACCACCTGCCCATGTGGAGCACAGATCACCGGACATGTGAAA7\ACGGTTCCATGAG 

I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4804 ACCACCTGCCCATGTGGAGCACAGATCACCGGACATGTGAAAAACGGTTCCATGAG 
1002 T T C P C GAQ I T GHVK-N GSMR 



CDS : polyprotein 
Query 

Sbjct 



[Hep 2047 VGPRTCSNTWHGTFPINAY 
6480 GTGGGGCCTAGGACCTGTAGTAACACGTGGCATGGAACATTCCCCATT7\ACGCGTA 
I I I I I II II I I I II I I I I I I I 11 II I II I I II I I II II I I II I I II I I I I I I II I I 
4864 GTGGGGCCTAGGACCTGTAGTAACACGTGGCATGGAACATTCCCCATTAACGCGTA 



http://www.ncbi.nl^l.nih,gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 1022 V G P 



N 



W H G T 



N 



CDSrpolyprotein [Hep 2067 

Query 6540 

Sbjct 4924 

CDS : non-structural p 1042 



TGPCTPSP APNYSRALWRV 
ACGGGCCCCTGCACGCCCTCCCCGGCGCCAAATTATTCTAGGGCGCTGTGGCGGGT 
I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGGGCCCCTGCACGCCCTCCCCGGCGCCAAATTATTCTAGGGCGCTGTGGCGGGT 

TGPCTPSPAPNYSRALWRV 



CDS:polyprotein [Hep 2087 

Query 6600 

Sbjct 4984 

CDS : non-structural p 1062 



AEEYV EV TRVGDFHYVTGM 
GCTGAGGAGTACGTGGAGGTTACGCGGGTGGGGGATTTCCACTACGTGACGGGCAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCTGAGGAGTACGTGGAGGTTACGCGGGTGGGGGATTTCCACTACGTGACGGGCAT 

AEEYVEVTRVGDFHYVTGM 



CDSrpolyprotein [Hep 2107 

Query 6660 

Sbjct 5044 

CDS: non-structural p 1082 



TDNVKCPC QVPAPEFFTE'V 
ACTGACAACGTA7\AGTGCCCGTGTCAGGTTCCGGCCCCCGAATTCTTCACAGAAGT 
I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I 
ACTGACAACGTAAAGTGCCCGTGTCAGGTTCCGGCCCCCGAATTCTTCACAGAAGT 

TDNVKCPCQVPAPEFFTEV 



CDS:polyprotein [Hep 2127 

Query 6720 

Sbjct 5104 

CDS : non-structural p 1102 



GVRLHRYAPACKPLLREEV 
GGGGTGCGGTTGCACAGGTACGCTCCAGCGTGCAAACCCCTCCTACGGGAGGAGGT 
i I I I I I I I I I I I I I I I 1 I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGGTGCGGTTGCACAGGTACGCTCCAGCGTGCAAACCCCTCCTACGGGAGGAGGT 

GVRLHRYAPACKPLLREEV 



CDS rpolyprotein [Hep 2147 
Query 



Sbjct 

CDS: non-structural p 



FLVGLNQYLVGSQLPCEPE 
6780 TTCCTGGTCGGGCTCAATCAATACCTGGTTGGGTCACAGCTCCCATGCGAGCCCGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5164 TTCCTGGTCGGGCTCAATCAATACCTGGTTGGGTCACAGCTCCCATGCGAGCCCGA 
1122 FLVGLNQYLVGSQLPCEPE 



CDS:polyprotein [Hep 2167 

Query 6840 

Sbjct 5224 

CDS: non-structural p 1142 



DVA VLTSMLTDPSHITAET 
GACGTAGCAGTGCTCACTTCCATGCTCACCGACCCCTCCCACATTACGGCGGAGAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
GACGTAGCAGTGCTCACTTCCATGCTCACCGACCCCTCCCACATTACGGCGGAGAC 

DVAVLTSMLTDPSHITAET 



CDS rpolyprotein [Hep 2187 

Query 6900 

Sbjct 5284 

CDS : non-structural p 1162 



KRRLARGS P PS L AS S SAS Q 
AAGCGTAGGCTGGCCAGGGGATCTCCCCCCTCCTTGGCCAGCTCATCAGCTAGCCA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
AAGCGTAGGCTGGCCAGGGGATCTCCCCCCTCCTTGGCCAGCTCATCAGCTAGCCA 

KRRLARGS PPSLAS S SAS Q 



CDS rpolyprotein [Hep 2207 

Query 6960 

Sbjct 5344 

CDS: non-structural p 1182 



SAPSLKATCTTRHDSPDAD 
TCTGCGCCTTCCTTGAAGGCAACATGCACTACCCGTCATGACTCCCCGGACGCTGA 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
TCTGCGCCTTCCTTGAAGGCAACATGCACTACCCGTCATGACTCCCCGGACGCTGA 
SAPSLKATCTTRHDSPDAD 



CDS rpolyprotein [Hep 2227 

Query 7020 

Sbjct 5404 

CDS: non-structural p 1202 



lEAN LLWRQEMG GNITRVE 
ATCGAGGCCAACCTCCTGTGGCGGCAGGAGATGGGCGGGAACATCACCCGCGTGGA 

I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

ATCGAGGCCAACCTCCTGTGGCGGCAGGAGATGGGCGGGAACATCACCCGCGTGGA 
lEANLLWRQEMGGNITRVE 



CDS rpolyprotein [Hep 2247 
Query 7080 

Sbjct 5464 



ENKVVILD SFEPLQAEEDE 
GJW^ATAAGGTAGTAATTTTGGACTCTTTCGAGCCGCTCCAAGCGGAGGAGGATGA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n I I I I I I I I I I I I I I I I I I I 

GAAAATAAGGTAGTAATTTTGGACTCTTTCGAGCCGCTCCAAGCGGAGGAGGATGA 



http://www.ncbi.nlm.nih.gov/BLASmi2seq/wblast2.cgi?l 10/18/07 



Z.O/81/Ol 



l^igoxjSBiqM/b9S3iq/lSVia/^o8'HFUi|U'Tqou*AVA\M// 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

9W0909V090iL0XV0WDVXD9I.V10X99XX0WDV00V0JiO0010OXJ:.X0I.0W 
SVSHSXXVAAIN'HHHinSN 

TVNIdTMXaaVVOdXITVO 
XOVO9XWOXVOOOOXO9WOOWV9OVO9O9XO9OOXVOO9OVDXVOXDOOOO09 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II II I I I II 

XOVO9XWDXVDDO9XO9WOOW\fO3VOOOOXO9O£)XVDO0OVOXVOXODO9OOO 

TVNidaMxaavvodxiivo 
j^xAswsooAAaasvaasAX 

9XV0VOVXOOX9XV£)OXD9XDOX0XOOX9OV99V9XOVX099V99V£)09WX9D0\f 

II I I I I I I II I I I I I I I I I I I I I I I I I I II II I I I II II I I I II I I I I I II I I I I I 
9XV0V0VX00X9XVOOX09X0OX0X90X90V9OV0XOVX099V09VO09WX900V 

MXASws ooAAaasv a asAX 



^909 ^ofqs 

089^ AaanO 

L^^Z daH] UTa:^ojdA-|:od:sao 

ZOt'I d TeJn:ionj:^s-uou:sao 

1^009 :;oCqs 

LZ]?Z d^H] UTar^ojdAiodrsaD 

38SI d XBan:^onJ:;s-uou:sao 

095L Aj3n5 

LOl^S d3H] UT^:^oJdAIod:sa^ 



iis oasiadaDdaoaiddws 

OXXOX999OV9O9VDXOXV9DOOXV09999OO£)\f999e9^f9XXDDOOOOO9XVOOX 

I I II II I I II II II II I II I I M I I II I I II I I I I II I I I II II I I I II M II I I I 

9XXOX9990V9D9VOXOXV9000XV99999009V99999V9XXD0090009XVOOX 

MS9asiada9da9aiddws 



398:1 a XHj:n:;onj:;s-uou:saO 
Z.8e3 d^H] UTa:^ojdAiod:saD 



AsaAas9va9aasd5adsv 

VX9DX9V9XX90V900XV999090V90990V90V900X0009V30V9X00X0X0D9 

I II I I II I II II I I I II I I II I I I II I II I I I I I I I I I I I I M I I I I I I I I I I I I I 
VX90X9V9XX9DV900XV999090V90990V90>f900XDD09VO0V9XO0X0X309 

X s aAas9v. a9aavS d Oaa sv 



d -[;Gan:;ona:;s-uou:sao 
1^285 ^ofqs 

Z.9e2 ci^H] UTat^ojdATodrsao 



vx9saAvssass9^XMxvT: 

0990V09909V0V90X90D990X90XW9D0X09V099DXX00V9VW0V0090X0 
I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
0990V09909\fOV90X900990X9DXW9DOX09VD990XXOOV9W\fOV0090XO 
VX9 S'QAVS S a S S9.a XM XVI 

VTVSSAXSaSIAAXHMHHd 
399XX009X0XX0X9X900VX0XW9V0X9XDDX9XX990V99V9W99V990V00 
I I I I I I II I I I I I I I I I I I I I I II I I I I I I I i I I II I I I I I II I I I II I I I I II I I 
099XX009X0XX0X9X900VX0XW9V0X9X33X9XX990V99V9W99V990Vp0 
VTVSSAXSaSTAAXHMHHd 



ZZZX <J T^Jn:^3na::;s-uou:'sao 

!^9Z.S :;oCqs 

08eL AjanO 

^^e^ dan] UT^:^oJdAIod:sa^ 

I'OZ.S t^ofqs 

03eL AjanO 
dan] UTa:;oadA-i:od:sao 



d IddVMVddTdOOHAAddA 
OOVXV9OOXDDOO99WOO0XDO9OO9XXVOOX9X999OVOVX99X9VOOXOODX9 
I I II I II I II I I II I II II II I I I II II I II II II I II M M II I II I II II II II 
0OVXV900X0OOD99W0D9X0090D9XXV00X9X999OV0VX99X9V00X0O0X9 
d IddVMVdd1d09HAAddA 

adQMjyisaiTiddNAadHVMi 

V99900V99W99XOOX9\f9VXX9XOVODXOOOWO\fXXV9900090V0999XVXV 

I I II I II I I I I I I II I I M II I I I I I I I I I I I I I I II I I I I I I I II I I I II I I I I I 

V99DD0V99W99X00X9V9VXX9X0V00XD00W0VXXV990009DVD999XVXV 

adaMMsairEddNAadHVMi 

WVHdaMHSHHIiaVdASAa 
XV9D9V93X030XXVW99VOOX99V0909XOOXV9V9909900XX900XVX9W9 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
XV909V90XODOXX\?W99VOOX99V9909XODXV9V9909900XX990XVX9W9 
WVHdaMHSHHIiaVdASAa 



3831 d Tejnt^onjt^s-uouisao 
1^1^99 :;ofqs 

09ZZ. AaanO 

LO^Z dan] uTa:;ojdATod:sao 

3931 d -[HJn:iona:is-uou: sao ^ 

OOZL AjanO 

^833 <J9H] UTa:;oadATod:saO 

3t^3T d Tean::;onj:is-uou:sao 
^zqg t^oCqs 

O^TZ. AjanO 

L9ZZ dan] UTa:;ojdAiod:sao 



a 



a 



a 



M N a 3331 d TPjn:;onj:^s-uou:saO 



CDS: non-structural p 1422 



N 



H H N L V 



CDSrpolyprotein [Hep 2467 



Query 
Sbjct 

CDS : non-structural p 



RQKKVTFDRLQVLDDHYRD 
7740 CGGCAGAAGAAGGTCACCTTTGACAGACTGCAGGTCCTGGACGACCACTACCGGGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6124 CGGCAGAAGAAGGTCACCTTTGACAGACTGCAGGTCCTGGACGACCACTACGGGGA 
1442 RQKKVTFDRLQVLDDHYRD 



CDSrpolyprotein [Hep 2487 

Query 7800 

Sbjct 6184 

CDS: non-structural p 1462 



LKEMKAKASTVKAKLLSVE 
CTCAAGGAGATGAAGGCGAAGGCGTCCACAGTTAAGGCTAAACTTCTATCCGTGGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I M I 
CTCAAGGAGATGAAGGCGAAGGCGTCCACAGTTAAGGCTA7\ACTTCTATCCGTGGA 

LKEMKAKASTVKAKLLSVE 



CDSrpolyprotein [Hep 2507 

Query 7860 

Sbjct 6244 

CDS : non-structural p 1482 



ACKLTPPHSARSKFG YGAK 
GCCTGTAAGCTGACGCCCCCACATTCGGCCAGATCTAAATTTGGCTATGGGGCAAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Tl I I I I I I I I 
GCCTGTAAGCTGACGCCCCCACATTCGGCCAGATCTAAATTTGGCTATGGGGCAAA 

ACKLTPPHSARSKFGYGAK 



CDSrpolyprotein [Hep 2527 

Query 7920 

Sbjct 6304 

CDS: non-structural p 1502 



VRNLSSKAVNHIRSVWKDL 
GTCCGGAACCTATCCAGCAAGGCCGTTAACCACATCCGCTCCGTGTGGAAGGACTT 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I i I I I I I I I I t ] I I I I I I I I I I I I I 

GTCCGGAACCTATCCAGCAAGGCCGTTAACCACATCCGCTCCGTGTGGAAGGACTT 
VRNLSSKAVNHIRSVWKDL 



CDSrpolyprotein [Hep 2547 

Query 7980 

Sbjct 6364 

CDS : non-structural p 1522 



ED TETP IDTTIMAKNEVFC 
GAAGACACTGAGACACCAATTGACACCACCATCATGGCAAA7\AATGAGGTTTTCTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I M I I I I I I I I I 
GAAGACACTGAGACACCAATTGACACCACCATCATGGCAAAAAATGAGGTTTTCTG 

EDTETPIDTTIMAK NEVFC 



CDSrpolyprotein [Hep '2567 

Query 8040 

Sbjct 6424 

CDS r non-structural p 1542 



QPEKGGRKPARLIVFPDLG 

CAACCAGAGAAGGGGGGCCGCAAGCCAGCTCGCCTTATCGTATTCCCAGATTTGGG 

I I I I I I I I I I I I I M I I I I I I I i i I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I 

CAACCAGAGAAGGGGGGCCGCAAGCCAGCTCGCCTTATCGTATTCCCAGATTTGGG 
QPEKGGRK PARLIVFPDLG 



CDSrpolyprotein [Hep 2587 

Query 8100 

Sbjct 6484 

CDS r non-structural p 1562 



RVCEKMALYDVVSTLPQAV 
CGTGTGTGCGAGA/\AATGGCCCTTTACGATGTGGTCTCCACCCTCCCTCAGGCCGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGTGTGTGCGAGA7\AATGGCCCTTTACGATGTGGTCTCCACCCTCCCTCAGGCCGT 

RVCEKMALYDVVSTLPQAV 



CDSrpolyprotein [Hep 2607 

Query 8160 

Sbjct 6544 

CDS r non-structural p 1582 



GSSYGFQYSPGQRVEFLVN 
GGCTCTTCATACGGATTCCAATACTCTCCTGGACAGCGGGTCGAGTTCCTGGTGAA 

I I I I I M j I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

GGCTCTTCATACGGATTCCAATACTCTCCTGGACAGCGGGTCGAGTTCCTGGTGAA 
GSSYGFQYSPGQRVEFLVN 



CDSrpolyprotein [Hep 2627 

Query 8220 

Sbjct 6604 

CDS r non-structural p 1602 



WKAKKCPMGFAYDTRCFDS 
TGGAAAGCGAAGAAATGCCCTATGGGCTTCGCATATGACACCCGCTGTTTTGACTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGAAAGCGAAGAAATGCCCTATGGGCTTCGCATATGACACCCGCTGTTTTGACTC 

WKAKKCPMGFAYDTRCFDS 



CDS r polyprotein 
Query 

Sbjct 



[Hep 2647 VTENDIRVEESIYQCCDLA 
8280 GTCACTGAGAATGACATCCGTGTTGAGGAGTCAATCTACCAATGTTGTGACTTGGC 
I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I 
6664 GTCACTGAGAATGACATCCGTGTTGAGGAGTCAATCTACCAATGTTGTGACTTGGC 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p 1622 



VTENDIRVEESIY QCCDLA 



CDS ipolyprotein [Hep 2667 

Query 8340 

Sbjct 6724 

CDS: non-structural p 1642 



EARQAIRSLTERLYIGGPL 
GAAGCCAGACAGGCCATAAGGTCGCTCACAGAGCGGCTTTACATCGGGGGCCCCCT 
I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAGCCAGACAGGCCATAAGGTCGCTCACAGAGCGGCTTTACATCGGGGGCCCCCT 

EARQAIRSLTERLYIGGP L 



CDS:polyprotein [Hep 2687 

Query 8400 

Sbjct 6784 

CDS : non-structural p 1662 



NS KGQNCGYRRCRASGVLT 

AATTCTAAAGGGCAGAACTGCGGCTATCGCCGGTGCCGCGCGAGCGGTGTACTGAC 
I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 
AATTCTAT^AGGGCAGAACTGCGGCTATCGCCGGTGCCGCGCGAGCGGTGTACTGAC 
NSKGQNCGYRRCRASGVLT 



CDS :polyprotein [Hep 2707 

Query 8460 

Sbjct 6844 

CDS: non-structural p 1682 



SCGNTLTC YLKAAAACRAA 
AGCTGCGGTAATACCCTCACATGTTACTTGAAGGCCGCTGCGGCCTGTCGAGCTGC 
I I I I I I I I I 11 I I I I I 1 I I 1 I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCTGCGGTAATACCCTCACATGTTACTTGAAGGCCGCTGCGGCCTGTCGAGCTGC 

SCGNTLTCYLKAAAACRAA 



CDS:polyprotein [Hep 2727 

Query 8520 

Sbjct 6904 

CDS: non-structural p 1702 

CDSrpolyprotein [Hep 2747 

Query 8580 

Sbjct 6964 

CDS: non-structural p 1722 



LQDCTMLVCG DDLVVI CE S 
CTCCAGGACTGCACGATGCTCGTATGCGGAGACGACCTTGTCGTTATCTGTGAAAG 
I I I I I I I I I I I 1 I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCCAGGACTGCACGATGCTCGTATGCGGAGACGACCTTGTCGTTATCTGTGAAAG 

LQDCTMLVCGDDLVVI CE S 

GTQEDEAiSLRAFTEAMTRY 
GGGACCCAAGAGGACGAGGCGAGCCTACGGGCCTTCACGGAGGCTATGACTAGATA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGACCCAAGAGGACGAGGCGAGCCTACGGGCCTTCACGGAGGCTATGACTAGATA 

GTQEDEASLRAFTEAMTRY 



CDS:polyprotein [Hep 2767 

Query 8640 

Sbjct 7024 

CDS: non-structural p 1742 



APPGDPPKPEYDLELITSC 
GCCCCCCCTGGGGACCCGCCCAAACCAGAATACGACTTGGAGTTGATAACATCATG 
I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I 
GCCCCCCCTGGGGACCCGCCCAAACCAGAATACGACTTGGAGTTGATAACATCATG 

APPGDPPKPEYDLELI TSC 



CDS ipolyprotein [Hep 2787 

Query 8700 

Sbjct 7084 

CDS: non-structural p 1762 



SNVSVAHDASGKRVYYLTR 
TCCAATGTGTCAGTCGCGCACGATGCATCTGGCAAAAGGGTGTACTATCTCACCCG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCAATGTGTCAGTCGCGCACGATGCATCTGGCAAAAGGGTGTACTATCTCACCCG 

SNVSVAHDASGKRVYYLTR 



CDS:polyprotein [Hep 2807 

Query 8760 

Sbjct 7144 

CDS: non-structural p 1782 



PTTPLARAAWETARHTPVN 
CCCACCACCCCCCTTGCGCGGGCTGCGTGGGAGACAGCTAGACACACTCCAGTCAA 
I I I I I I I I 11 I I I I I I I I I I I I I I I i I I t I I I I I I I I I I I I I I I I I I I 11 I I i I I I 
CCCACCACCCCCCTTGCGCGGGCTGCGTGGGAGACAGCTAGACACACTCCAGTCAA 

PTTPLARAAWETARHTPVN 



CDS:polyprotein [Hep 2827 

Query 8820 

Sbjct 7204 

CDS: non-structural p 1802 



WLGNI IMYAPTLWARMILM 
TGGCTAGGCAACATCATCATGTATGCGCCCACCTTGTGGGCAAGGATGATCCTGAT 

I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I 1 .1 I I I I I I I I M 

TGGCTAGGCAACATCATCATGTATGCGCCCACCTTGTGGGCAAGGATGATCCTGAT 
WLGNIIMYAPTLWARMILM 



CDS:polyprotein [Hep 2847 
Query 8880 

Sbjct 7264 



HFFSILLAQEQLEKA LDCQ 
CATTTCTTCTCCATCCTTCTAGCTCAGGAACAACTTGAAAAAGCCCTAGATTGTCA 
I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CATTTCTTCTCCATCCTTCTAGCTCAGGAACAACTTGAAAAAGCCCTAGATTGTCA 



http://www.ncbi.nlm.nih.gov/BLAST^12seq/wblast2.cgi?l 



10/18/07 



CDS: non-structural p . 1822 



H 



L A Q 



Q 



K 



CDS: polyp rotein [Hep 2867 

Query 8940 

Sbjct 7324 

CDS: non-structural p 1842 



YGACYSIEPLDLPQI IQR L 
TACGGGGCCTGTTACTCCATTGAGCCACTTGACCTACCTCAGATCATTCAACGACT 
I I I I I I I I I I I I I I I i I I I i I I I I I I I I I I I I I I I I I i I I I I I I I !•! I I I I I I I I I 
TACGGGGCCT GTT ACT CCATT GAGCCACTT GACCTACCTCAGAT CATT CAACGACT, 

YGACYSIEPLDLPQIIQRL 



CDS:polyprotein [Hep 2887 

Query 9000 

Sbjct 7384 

CDS: non-structural p 1862 



GLSAFSLHSYSPGE INRVA 
GGCCTTAGCGCATTTTCACTCCATAGTTACTCTCCAGGTGAGATCAATAGGGTGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I M I I I I I I I I I I I I I I I I 
GGCCTTAGCGCATTTTCACTCCATAGTTACTCTCCAGGTGAGATCAATAGGGTGGC 

GLSAFSLHSYSPGEINRVA 



CDS :polyprotein [Hep 2 907 

Query 9060 

Sbjct 7444 

CDS: non-structural p 1882 



CLRKL GVPPLRVWRHRA RS 
TGCCT CAGGAAACTT GGGGTACCGCCCTTGCGAGT CT GGAGACAT CGGGCCAGAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCCTCAGGAAACTTGGGGTACCGCCCTTGCGAGTCTGGAGACATCGGGCCAGAAG 

CLRKLGVPPLRVWRHRARS 



CDS:polyprotein [Hep 2927 
Query 



Sbjct 

CDS : non-structural p 



RARL L S QGG'RAAT C GKY L F 
9120 CGCGCTAGGCTACTGTCCCAGGGGGGGAGGGCTGCCACTTGTGGCAAGTACCTCTT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

7504 CGCGCTAGGCTACTGTCCCAGGGGGGGAGGGCTGCCACTTGTGGCAAGTACCTCTT 
1902 RARLLSQGGRAATCGKYLF 



CDS ipolyprotein [Hep 2947 

Query 9180 

Sbjct 7564 

CDS: non-structural p 1922 



WAVRTKLKLTPI PAASQLD 
TGGGCAGTAAGGACCAAGCTCAAACTCACTCCAATCCCGGCTGCGTCCCAGTTGGA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGGCAGTAAGGACCAAGCTCA/\ACTCACTCCAATCCCGGCTGCGTCCCAGTTGGA 

WAVRTKLKL TPI PAASQLD 



CDS :polyprotein [Hep 
Query 



Sbjct 
CDS : non- 



structural p 



2967 S SWFVAGYS GGDI Y H S LS R 
9240 TCCAGCTGGTTCGTTGCTGGTTACAGCGGGGGAGACATATATCACAGCCTGTCTCG 
I i I i I I I I I I i I i i I I I I I I I I I I I I I I I I i I I I I I I i I I Ml I I I I I I I i i 1 I I I 
7624 TCCAGCTGGTTCGTTGCTGGTTACAGCGGGGGAGACATATATCACAGCCTGTCTCG 
1942 SSWFVAGYSGGDIYHSLS R 



CDS:polyprotein [Hep 2987 

Query 9300 

Sbjct 7684 

CDS : non-structural p 1962 



RPRWFMWCLLLLSVGVGIY 
CGACCCCGCTGGTTCATGTGGTGCCTACTCCTACTTTCTGTAGGGGTAGGCATCTA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n 

CGACCCCGCTGGTTCATGTGGTGCCTACTCCTACTTTCTGTAGGGGTAGGCATCTA 
RPRWFMWCLLLLSVGVGIY 



CDS:polyprotein [Hep 
Query 



Sbjct 
CDS : non- 



structural p 



3007 L' P N R 

9360 CTCCCCAACCGATGAACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTG 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7744 CTCCCCAACCGATGAACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTG 7 
1982 L P N R 



Score = 696 bits (362), Expect =0.0 
Identities = 376/376 (100%), Gaps == 0/376 (0%) 
Strand=Plus/Plus 
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Query 2 

Sbjct 2 

Query 62 

Sbjct 62 

Query 122 

Sbjct 122 

Query 182 

Sbjct 182 

Query 242 

Sbjct 242 

CDS:polyprotein [Hep 1 

Query 302 

Sbjct 302 

CDS:core-neo fusion 1 

CDSrpolyprotein- [Hep 8 

Query 362 

Sbjct 362 

CDS:core-neo fusion 8 



CCAGCCCCCGATTGGGGGCGACACTCCACCATAGATCACTCCCCTGTGAGGAACTAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I 
CCAGCCCCCGATTGGGGGCGACACTCCACCATAGATCACTCCCCTGTGAGG7\ACTAC 

CTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGG 
I I I I I I i 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTTCACGCAGAAAGCGTCTAGCCATGGCGTTAGTATGAGTGTCGTGCAGCCTCCAGG 

CCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCCCTCCCGGGAGAGCCATAGTGGTCTGCGGAACCGGTGAGTACACCGGAATTGCC 

ACGACCGGGTCCTTTCTTGGATCAACCCGCTCAATGCCTGGAGATTTGGGCGTGCCC 
I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGACCGGGTCCTTTCTTGGATCAACCCGCTCAATGCCTGGAGATTTGGGCGTGCCC 

CGAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGAGACTGCTAGCCGAGTAGTGTTGGGTCGCGAAAGGCCTTGTGGTACTGCCTGATA 

M S T N P K 

TGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACCATGAGCACGAATCCTAA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCTTGCGAGTGCCCCGGGAGGTCTCGTAGACCGTGCACCATGAGCACGAATCCTAA 

M S T N P K 

Q R K T K 
TCAAAGAAAAACCAAA 377 
I I I I I I I I I I I I I I I I 
TCAAAGAA7WVCCAAA 377 

Q R K T K 



Score = 189 bits (98), Expect = 2e-43 
Identities = 98/98 (100%), Gaps = 0/98 (0%) 
S t rand=Plus / Plus 



Query 9508 



Sbjct 7892 
Query 9568 



Sbjct 7952 



GGTGGCTCCATCTTAGCCCTAGTCACGGCTAGCTGTGAAAGGTCCGTGAGCCGCTTGACT 9567 
I I I I I I I I M I I I I I I I I M I i I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I 
GGTGGCTCCATCTTAGCCCTAGTCACGGCTAGCTGTGAAAGGTCCGTGAGCCGCTTGACT 7951 

GCAGAGAGTGCTGATACTGGCCTCTCTGCAGATCAAGT 9605 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCAGAGAGTGCTGATACTGGCCTCTCTGCAGATCAAGT 7989 



CPU time: 



0.15 user sees. 



0.04 sys. sees 



0.19 total sees. 
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